1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 금융 분야 Machine Learning

Connected

연습 문제

결과 확인하기

최적화한 모델이 준비되면, 성능을 좀 더 자세히 확인해 보고 싶어요. 이미 R\(^2\) 점수를 봤지만, 예측값과 실제값을 비교해 그려 보면 더 도움이 됩니다. 의사결정나무 모델의 .predict() 메서드를 사용해 학습 세트와 테스트 세트에서 예측값을 얻을 수 있어요.

이상적으로는 왼쪽 아래에서 오른쪽 위로 올라가는 대각선 형태가 보이면 좋습니다. 하지만 의사결정나무의 단순성 때문에, 이 모델은 테스트 세트에서는 성능이 좋지 않을 거예요. 대신 학습 세트에서는 성능이 좋게 나올 것입니다.

지침

100 XP
  • max_depth 하이퍼파라미터를 3으로 설정해 DecisionTreeRegressor 모델 decision_tree를 생성하세요.
  • 의사결정나무 모델로 학습 및 테스트 세트(train_features와 test_features)에 대한 예측을 만드세요.
  • plt.scatter()로 학습 및 테스트 예측값을 실제 타깃 값과 산점도로 비교해 그리세요. 테스트 세트에는 label 인수를 test로 설정하세요.