1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Học có giám sát với scikit-learn

Connected

Bài tập

Chuẩn hóa trung tâm và tỉ lệ cho hồi quy

Giờ bạn đã thấy lợi ích của việc scale dữ liệu, bạn sẽ dùng một pipeline để tiền xử lý các đặc trưng trong music_df và xây dựng mô hình hồi quy lasso để dự đoán độ lớn âm lượng của một bài hát.

X_train, X_test, y_train, và y_test đã được tạo từ bộ dữ liệu music_df, trong đó mục tiêu là "loudness" và các đặc trưng là toàn bộ các cột còn lại. Lasso và Pipeline cũng đã được import sẵn cho bạn.

Lưu ý rằng "genre" đã được chuyển thành một đặc trưng nhị phân, trong đó 1 là bài rock và 0 là các thể loại khác.

Hướng dẫn

100 XP
  • Import StandardScaler.
  • Tạo các bước cho đối tượng pipeline: một StandardScaler gọi là "scaler", và một mô hình lasso gọi là "lasso" với alpha đặt thành 0.5.
  • Khởi tạo một pipeline với các bước scale và xây dựng mô hình hồi quy lasso.
  • Tính giá trị R-squared trên dữ liệu test.