1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 연습하는 Machine Learning 면접 질문

Connected

연습 문제

이상치 탐지

데이터를 올바르게 전처리하는 데서 매우 중요한 요소가 바로 이상치 탐지예요. Machine Learning 면접에서는 이상치를 어떻게 찾고 처리할지 묻는 경우가 많습니다. 이상치를 쉽게 파악하는 방법 중 하나는 그래프로 시각화하는 것이죠.

결측치를 찾아 보완한 다음에는, 이상치를 찾아서 어떻게 처리할지 결정하는 단계가 또 하나의 필수 전처리 과정입니다.

이상치를 시각화할 수 있는 패키지는 여러 가지가 있지만, 이번 연습에서는 seaborn을 사용해 loan_data의 선택된 열에 대해 단변량 및 다변량 박스플롯을 그려 보겠습니다.

필요한 패키지는 모두 임포트되어 있어요.

파이프라인에서 지금 어디쯤 와 있나요?

Machine learning pipeline

지침 1/3

undefined XP
  • 1
    • loan_data의 Annual Income 특성으로 단변량 박스플롯을 만드세요.
    • loan_data의 Annual Income 특성을 사용해 Loan Status로 조건부 설정한 다변량 박스플롯을 만드세요.
  • 2
    • loan_data의 Monthly Debt 특성으로 단변량 박스플롯을 만드세요.
    • loan_data의 Monthly Debt 특성을 사용해 Loan Status로 조건부 설정한 다변량 박스플롯을 만드세요.
  • 3
    • loan_data의 Years of Credit History 특성으로 단변량 박스플롯을 만드세요.
    • loan_data의 Years of Credit History 특성을 사용해 Loan Status로 조건부 설정한 다변량 박스플롯을 만드세요.