1. Learn
  2. /
  3. Courses
  4. /
  5. Học có giám sát với scikit-learn

Connected

Exercise

Pipeline để dự đoán độ phổ biến của bài hát

Ở bài tập cuối, bạn sẽ xây dựng một pipeline để bù khuyết giá trị thiếu, chuẩn hóa đặc trưng và tinh chỉnh siêu tham số cho mô hình logistic regression. Mục tiêu là tìm bộ tham số và độ chính xác tốt nhất khi dự đoán thể loại bài hát!

Tất cả mô hình và đối tượng cần thiết để xây dựng pipeline đã được nạp sẵn cho bạn.

Instructions

100 XP
  • Tạo các bước cho pipeline bằng cách gọi simple imputer, standard scaler và mô hình logistic regression.
  • Tạo một đối tượng pipeline và truyền biến steps vào.
  • Khởi tạo một đối tượng grid search để thực hiện cross-validation sử dụng pipeline và các tham số.
  • In ra các tham số tốt nhất và tính rồi in điểm độ chính xác trên tập kiểm tra cho đối tượng grid search.