1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 연습하는 Machine Learning 면접 질문

Connected

연습 문제

반복적 대치(Iterative imputation)

이전 연습 문제에서는 loan_data의 결측값을 평균으로 대치했어요. 하지만 Machine Learning 면접에서는 데이터셋의 다른 특성에 의존하는, 더 동적인 대치 기법에 대해 묻는 경우가 많습니다.

이번 연습에서는 sklearn.impute의 IterativeImputer()를 사용해 남아 있는 특성들을 함수로 하여 결측값을 채우는 머신러닝 기반 접근법을 연습해 볼 거예요. 이는 다변량 대치 기법으로, 각 특성을 나머지 모든 특성으로부터 ‘라운드로빈’ 방식으로 추정합니다.

이 함수는 실험적 기능로 분류되므로, 자세한 내용은 문서를 참고해 주세요.

지금은 파이프라인에서 다음 단계에 와 있습니다:

Machine learning pipeline

지침 1/4

undefined XP
    1
    2
    3
    4
  • loan_data의 숫자형 열만 부분 선택해서 numeric_cols에 할당하세요.