Pipeline để dự đoán độ phổ biến của bài hát

Ở bài tập cuối, bạn sẽ xây dựng một pipeline để bù khuyết giá trị thiếu, chuẩn hóa đặc trưng và tinh chỉnh siêu tham số cho mô hình logistic regression. Mục tiêu là tìm bộ tham số và độ chính xác tốt nhất khi dự đoán thể loại bài hát!

Tất cả mô hình và đối tượng cần thiết để xây dựng pipeline đã được nạp sẵn cho bạn.

Tạo các bước cho pipeline bằng cách gọi simple imputer, standard scaler và mô hình logistic regression.
Tạo một đối tượng pipeline và truyền biến steps vào.
Khởi tạo một đối tượng grid search để thực hiện cross-validation sử dụng pipeline và các tham số.
In ra các tham số tốt nhất và tính rồi in điểm độ chính xác trên tập kiểm tra cho đối tượng grid search.

Bài tập

Pipeline để dự đoán độ phổ biến của bài hát

Hướng dẫn

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}Bài tập

Hướng dẫn

Bài tập