1. Учиться
  2. /
  3. Courses
  4. /
  5. scikit-learn으로 배우는 Supervised Learning

Connected

Exercise

회귀를 위한 중심화와 스케일링

이제 스케일링의 이점을 확인했으니, 파이프라인을 사용해 music_df의 특성을 전처리하고 라쏘 회귀 모델로 노래의 loudness를 예측해 보겠습니다.

타깃이 "loudness"이고 특성은 데이터셋의 나머지 모든 열인 music_df에서 X_train, X_test, y_train, y_test가 이미 생성되어 있어요. Lasso와 Pipeline도 미리 import되어 있습니다.

참고로 "genre"는 이진 특성으로 변환되어 1은 록(rock) 곡을, 0은 다른 장르를 의미합니다.

Инструкции

100 XP
  • StandardScaler를 import하세요.
  • 파이프라인 객체의 단계로, "scaler"라는 이름의 StandardScaler와 alpha가 0.5인 "lasso" 라쏘 모델을 생성하세요.
  • 스케일링과 라쏘 회귀 모델을 포함한 단계로 파이프라인을 인스턴스화하세요.
  • 테스트 데이터에 대한 R-제곱값을 계산하세요.