1. Lära sig
  2. /
  3. Courses
  4. /
  5. Python으로 연습하는 Machine Learning 면접 질문

Connected

exercise

단순 대치(Simple imputation)

이전 연습 문제에서 보셨듯이, 데이터를 삭제하면 전체 데이터셋이 지나치게 줄어들 수 있어요. 면접 상황에서는 이로 인해 Machine Learning 모델의 결과가 편향될 위험이 있습니다.

결측치를 다루는 더 유연한 방법은 값을 대치(impute)하는 것입니다. Python에는 여러 방법이 있지만, 이번 연습에서는 sklearn.impute 모듈의 SimpleImputer() 함수를 loan_data에 적용해 보겠습니다.

그다음 pandas와 numpy를 사용해 대치된 데이터를 DataFrame으로 변환할 거예요.

이제 파이프라인에 두 단계, Instantiate와 Fit이 추가됩니다: Machine learning pipeline

Instruktioner 1 / 4

undefined XP
    1
    2
    3
    4
  • loan_data에서 숫자형 열만 하위 선택해 numeric_cols에 할당하세요.