1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Học có giám sát với scikit-learn

Connected

Bài tập

Chuẩn hóa tâm và tỉ lệ cho bài toán phân loại

Giờ bạn sẽ kết hợp bước scaling và xây dựng mô hình vào một pipeline để cross-validation.

Nhiệm vụ của bạn là xây dựng một pipeline để scale các đặc trưng trong tập dữ liệu music_df và thực hiện grid search cross-validation bằng mô hình logistic regression với các giá trị khác nhau cho siêu tham số C. Biến mục tiêu là "genre", trong đó gán nhãn nhị phân: rock là 1 và các thể loại khác là 0.

StandardScaler, LogisticRegression, và GridSearchCV đã được import sẵn cho bạn.

Hướng dẫn

100 XP
  • Xây dựng các bước cho pipeline: một đối tượng StandardScaler() có tên "scaler", và một mô hình logistic regression có tên "logreg".
  • Tạo parameters, tìm kiếm 20 giá trị float cách đều trong khoảng từ 0.001 đến 1.0 cho siêu tham số C của mô hình logistic regression trong pipeline.
  • Khởi tạo đối tượng grid search.
  • Fit đối tượng grid search với dữ liệu huấn luyện.