1. 学ぶ
  2. /
  3. コース
  4. /
  5. scikit-learn으로 배우는 Supervised Learning

Connected

演習

범주형 특성을 활용한 회귀

이제 각 노래의 장르에 대한 이진 특성을 담은 music_dummies를 만들었으니, 노래의 인기도를 예측하는 ridge 회귀 모델을 구축해 보겠습니다.

music_dummies는 미리 로드되어 있으며, Ridge, cross_val_score, numpy는 np로, 그리고 KFold 객체는 kf로 제공됩니다.

모델 평가는 평균 RMSE를 계산하여 진행합니다. 먼저 각 폴드의 점수를 양수로 변환한 뒤 제곱근을 취해야 합니다. 이 지표는 모델 예측의 평균 오차를 나타내므로, 타깃 값인 "popularity"의 표준편차와 비교할 수 있습니다.

指示

100 XP
  • music_dummies의 모든 특성을 포함하는 X와, "popularity" 열로 구성된 y를 각각 생성하세요.
  • alpha를 0.2로 설정하여 ridge 회귀 모델을 인스턴스화하세요.
  • ridge 모델을 사용해 X와 y에 대해 교차 검증을 수행하고, cv는 kf로 설정하며, 평가지표는 negative mean squared error로 지정하세요.
  • 음수인 scores를 양수로 바꾼 뒤 제곱근을 취해 RMSE 값을 출력하세요.