1. Learn
  2. /
  3. Courses
  4. /
  5. Python으로 연습하는 Machine Learning 면접 질문

Connected

Exercise

결측값 찾기

결측값 처리에 대한 질문은 어떤 Machine Learning 면접에서도 핵심입니다. 결측값이 있는 데이터셋이 주어졌을 때 이를 처리하지 않으면, 결과가 왜곡되고 모델 정확도가 낮아질 가능성이 큽니다.

이 연습 문제에서는 고객 대출 데이터셋에서 pandas와 numpy를 사용해 결측값을 찾아보고 처리 방법을 탐색하며, 전처리의 첫 단계를 연습해 볼 거예요.

이 강의의 여러 연습 문제에서 사용할 데이터셋은 작업 공간에 loan_data로 저장되어 있습니다.

현재 파이프라인에서의 위치는 다음과 같습니다:

Machine learning pipeline

Instructions 1/4

undefined XP
  • 1
    • loan_data의 각 피처와 해당 결측값 개수를 출력하세요.
  • 2
    • 결측값이 있는 행을 삭제하고, 남은 행의 비율(%)을 출력하세요.
  • 3
    • 결측값이 있는 열을 삭제하고, 남은 열의 비율(%)을 출력하세요.
  • 4
    • loan_data의 결측값을 0으로 대치하여 loan_data_filled에 저장하세요.
    • 대치 전(loan_data)과 대치 후(loan_data_filled)의 'Credit Score'를 .describe()로 비교하세요.