1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 트리 기반 Machine Learning

Connected

연습 문제

최적의 숲 탐색하기

이 연습에서는 3-겹 교차 검증을 사용한 그리드 서치로 rf의 최적 하이퍼파라미터를 찾을 거예요. 그리드의 각 모델을 평가할 때는 negative mean squared error 지표를 사용합니다.

그리드 서치는 가능한 조합을 모두 탐색하는 방식이므로, 모델 학습에 시간이 오래 걸릴 수 있어요. 여기서는 GridSearchCV 객체를 생성만 하고 학습 데이터에 맞추지는 않겠습니다. 영상에서 설명했듯이, 이런 객체는 다른 scikit-learn 추정기와 마찬가지로 .fit() 메서드로 학습할 수 있어요:

grid_object.fit(X_train, y_train)

튜닝하지 않은 random forests 회귀 모델 rf와 이전 연습에서 정의한 사전 params_rf가 작업 공간에 준비되어 있어요.

지침

100 XP
  • sklearn.model_selection에서 GridSearchCV를 가져오세요.

  • 평가지표로 negative mean squared error를 사용하고, 3-겹 교차 검증을 사용하여 GridSearchCV 객체를 인스턴스화하세요.