1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 트리 기반 Machine Learning

Connected

연습 문제

최적의 랜덤 포레스트 평가하기

이 강의의 마지막 연습 문제에서는 grid_rf의 최적 모델에 대한 테스트 세트 RMSE를 평가해 보겠습니다.

데이터셋은 이미 로드 및 전처리되어 있으며, 80%는 학습용, 20%는 테스트용으로 분할되어 있습니다. 작업 환경에는 X_test, y_test, 그리고 sklearn.metrics에서 MSE라는 별칭으로 가져온 함수 mean_squared_error가 제공됩니다. 또한 이전 연습 문제에서 만들고 학습한 GridSearchCV 객체 grid_rf도 로드해 두었습니다. 참고로 grid_rf는 다음과 같이 학습했습니다:

grid_rf.fit(X_train, y_train)

지침

100 XP
  • sklearn.metrics에서 mean_squared_error를 MSE라는 이름으로 임포트하세요.

  • grid_rf에서 최적 추정기를 추출해 best_model에 할당하세요.

  • best_model로 테스트 세트 레이블을 예측하고 결과를 y_pred에 할당하세요.

  • best_model의 테스트 세트 RMSE를 계산하세요.