랜덤 포레스트로 예측 만들기

최적의 포트폴리오를 예측하는 Machine Learning 모델을 학습하려면, 성능 평가를 위한 학습/테스트 세트를 만들어야 해요. 이전 장과 마찬가지로 features와 targets 배열을 준비하고, 우리가 정한 train_size에 따라 분할하겠습니다. 보통 학습 세트의 비율은 전체 데이터의 70~90% 정도예요.

그다음 모델(이번에는 랜덤 포레스트)을 학습 데이터에 맞추고, 모델의 .score()로 학습/테스트 R\(^2\) 점수를 평가해요. 이번에는 하이퍼파라미터가 미리 설정되어 있지만, 일반적으로는 이전 장에서처럼 ParameterGrid로 탐색을 수행하는 편이 좋아요.