범주형 데이터 인코딩 방법의 모든것 – 데이터 과학자 필수 지식

인코딩 thumnail

데이터 과학과 머신러닝 분야에서, 데이터는 전처리 모든 분석과 예측 모델링의 가장 중요한 과정입니다. 특히 범주형 데이터는 다양한 분야에서 중요한 정보를 담고있는 경우가 많습니다. 범주형 데이터는 일반적으로 텍스트 형태로 저장되며, 기계 학습 모델이 이해할 수 있도록 숫자 형태로 변환하는 과정이 필수적입니다. 이 과정을 “인코딩(Encoding)”이라고 합니다. 데이터의 정보를 숫자로 표현하는 방법에 따라 머신러닝 모델의 성능이 크게 달라질