표준화 (1) 썸네일형 리스트형 2.3 데이터 전처리 이번에는 데이터 전처리에 대하여 정리해보도록 하겠습니다. 머신러닝은 데이터를 바탕으로 학습하고 예측합니다. 즉, 어떤 데이터를 가지고 학습하냐에 따라 해당 모델의 성능이 결정됩니다. 그만큼 데이터는 매우 중요합니다. 하지만 모든 데이터가 완전하지는 않습니다. 데이터에는 결손값(NaN)이 존재할 수 있습니다. 이러한 결손값은 처리되어야합니다. 또한 데이터 중에는 문자열이 존재할 수 있습니다. 하지만 문자열은 모델이 인식할 수 없기 때문에 이를 인코딩하여 숫자로 변환해야 합니다. 이번 시간에는 이러한 데이터 전처리를 어떻게 하는지에 대하여 배워보도록 하겠습니다. 이는 '파이썬 머신러닝 완벽 가이드'를 정리한 내용입니다. 1. 데이터 인코딩 데이터 인코딩은 문자열 피처를 숫자형으로 인코딩하는 것입니다. 문자열.. 이전 1 다음