1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 트리 기반 Machine Learning

Connected

연습 문제

최적의 트리 탐색

이 연습에서는 5-겹 교차 검증을 사용한 그리드 서치를 수행해 dt의 최적 하이퍼파라미터를 찾으려고 합니다. 그리드 서치는 모든 조합을 탐색하는 방식이므로, 모델 학습에 시간이 많이 걸릴 수 있습니다. 여기서는 GridSearchCV 객체만 생성하고, 학습 세트에 맞춰 학습시키지는 않습니다. 영상에서 설명했듯이, 이러한 객체는 scikit-learn 추정기와 동일하게 .fit() 메서드로 학습할 수 있습니다:

grid_object.fit(X_train, y_train)

튜닝하지 않은 분류 트리 dt와 이전 연습에서 정의한 사전 params_dt가 워크스페이스에 준비되어 있습니다.

지침

100 XP
  • sklearn.model_selection에서 GridSearchCV를 임포트하세요.

  • 다음 매개변수로 5-겹 교차 검증을 사용하는 GridSearchCV 객체를 생성하세요:

    • estimator는 dt, param_grid는 params_dt,

    • scoring은 'roc_auc'로 설정하세요.