1. Learn
  2. /
  3. Courses
  4. /
  5. Python으로 연습하는 Machine Learning 면접 질문

Connected

Exercise

의사결정나무

앞선 세 개의 장에서 Machine Learning 면접의 다양한 측면을 다루는 여러 기법을 배웠습니다. 이번 장에서는 면접에서 만들거나 설명해야 하는 어떤 모델이든 일반화 가능하고, 올바르게 평가되며, 가능한 다른 모델 중에서 적절히 선택되었는지 확인하는 다양한 방법을 살펴봅니다.

이 연습 문제에서는 loan_data 데이터셋에 대해 의사결정나무의 하이퍼파라미터 튜닝을 수행해 보겠습니다. 여기서는 추가적인 이진 분할을 만들기 위해 필요한 최소 샘플 수인 min_samples_split과 나무를 얼마나 깊게 성장시킬지 결정하는 max_depth를 튜닝합니다. 나무가 깊어질수록 분할이 늘어나며, 그만큼 데이터에 대한 정보를 더 많이 포착합니다.

특성 행렬 X와 타깃 레이블 y는 미리 불러와 두었습니다.

다시 한 번 Machine Learning 파이프라인의 모든 단계를 수행한다는 점을 기억하세요!

Machine learning pipeline

Instructions 1/2

undefined XP
  • 1
    • 의사결정나무 분류기에 필요한 올바른 함수를 임포트하고, 데이터를 학습/테스트 세트로 분할하세요.
    • 의사결정나무 분류기를 인스턴스화하고 학습, 예측을 수행한 뒤 정확도를 출력하세요.
  • 2
    • 교차 검증 기반 그리드 서치를 수행하기 위한 올바른 함수를 임포트하세요.
    • 의사결정나무 분류기를 인스턴스화하고, 파라미터 그리드와 함께 교차 검증 그리드 서치를 수행하세요.
    • 모델을 학습하고 평가 지표를 출력하세요.