1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서 결측치 다루기

Connected

연습 문제

KNN 대치

데이터셋에는 항상 서로 상관된 특성이 있습니다. 따라서 결측값을 대치할 때 이러한 상관관계를 고려하는 것이 중요해요. Machine Learning 모델은 DataFrame의 여러 특성을 활용해 상관관계와 패턴을 찾고, 선택한 특성을 예측합니다.

가장 간단하면서도 효율적인 모델 중 하나가 K Nearest Neighbors입니다. 이 방법은 기존 데이터 포인트와 가장 유사한 'K'개의 포인트를 찾아 결측값을 대치해요.

이번 연습에서는 diabetes DataFrame이 이미 로드되어 있습니다. fancyimpute 패키지를 사용해 diabetes DataFrame의 결측값을 대치하세요.

지침

100 XP
  • fancyimpute에서 KNN을 import하세요.
  • diabetes를 diabetes_knn_imputed로 복사하세요.
  • KNN() 객체를 생성해 knn_imputer에 할당하세요.
  • diabetes_knn_imputed DataFrame을 대치하세요.