회귀를 위한 중심화 및 스케일링

데이터 스케일링의 장점을 살펴봤으니, 이제 파이프라인을 사용하여 music_df의 특성을 전처리하고 라쏘(Lasso) 회귀 모델을 구축해 노래의 음량을 예측해 보겠습니다.

X_train 데이터셋에서 X_test, y_train, y_test, music_df가 생성되었으며, 타깃은 "loudness", 특성은 데이터셋의 나머지 모든 열입니다. Lasso와 Pipeline도 이미 임포트되어 있습니다.

"genre"는 이진 특성으로 변환되어 있으며, 1은 록 음악, 0은 그 외 장르를 나타냅니다.