1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 설계하는 Machine Learning 워크플로

Connected

연습 문제

첫 번째 파이프라인

동료가 신용 점수 데이터셋에 AdaBoostClassifier를 사용했습니다. 여러분은 랜덤 포레스트 분류기도 시도해 보려고 합니다. 이 연습에서는 이 분류기를 데이터에 학습시키고 AdaBoostClassifier와 비교해 볼 거예요. 과적합을 피하려면 반드시 학습/테스트 데이터 분할을 사용하세요. 데이터는 미리 로드되어 변환되어 있으며, 모든 특성은 수치형입니다. 특성은 X, 레이블은 y로 제공됩니다. RandomForestClassifier 모듈도 미리 로드되어 있습니다.

지침 1/3

undefined XP
    1
    2
    3
  • 데이터를 학습(X_train, y_train)과 테스트(X_test, y_test)로 분할하세요. 테스트 세트에는 전체의 20%를 사용하세요.