1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Thiết kế quy trình Machine Learning bằng Python

Connected

Bài tập

Pipeline đầu tiên của bạn

Đồng nghiệp của bạn đã dùng AdaBoostClassifier cho bộ dữ liệu chấm điểm tín dụng. Bạn cũng muốn thử một mô hình phân loại random forest. Trong bài tập này, bạn sẽ fit mô hình này vào dữ liệu và so sánh với AdaBoostClassifier. Hãy nhớ tách dữ liệu train/test để tránh overfitting. Dữ liệu đã được nạp sẵn và biến đổi để tất cả đặc trưng đều là số. Các đặc trưng có trong X và nhãn trong y. Mô-đun RandomForestClassifier cũng đã được nạp sẵn.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Chia dữ liệu thành train (X_train và y_train) và test (X_test và y_test). Dùng 20% số mẫu cho tập test.