1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Python에서의 앙상블 기법

Connected

Exercises

앱 평점 예측하기

이전 연습 문제에서 Google 앱 데이터셋을 살펴봤으니, 이제 일부 특성이 주어졌을 때 앱의 평점을 예측하는 모델을 만들어 보겠습니다.

이를 위해 scikit-learn의 DecisionTreeRegressor를 사용할 거예요. 의사결정나무는 많은 앙상블 모델의 기본 구성 요소이므로, 동작 방식을 복습해 두면 이 과정 전반에 큰 도움이 됩니다.

평가 지표로는 MAE(mean absolute error, 평균 절대 오차)를 사용합니다. 이 지표는 실제 평점과 예측 평점 간의 절대 차이의 평균을 의미해 해석이 매우 직관적입니다.

필요한 모듈은 모두 미리 임포트되어 있습니다. 특성과 타깃은 각각 X와 y 변수에 준비되어 있어요.

คำแนะนำ

100 XP
  • train_test_split()을 사용해 X와 y를 학습 세트와 테스트 세트로 분할하세요. 테스트 비율은 20%(0.2)로 지정합니다.
  • 다음 하이퍼파라미터로 DecisionTreeRegressor()를 인스턴스화하여 reg_dt를 만드세요: min_samples_leaf = 3, min_samples_split = 9.
  • .fit()을 사용해 학습 세트에 회귀 모델을 학습시키세요.
  • .predict()를 사용해 테스트 세트의 레이블을 예측하세요.