1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Thiết kế quy trình Machine Learning bằng Python

Connected

Bài tập

Trình chấm điểm tùy chỉnh trong pipelines

Bạn rất hài lòng vì chất lượng mã đã được cải thiện, nhưng vừa nhớ ra rằng trước đây bạn phải dùng một thước đo chấm điểm tùy chỉnh vì false positive gây tốn kém cho startup của bạn hơn false negative. Do đó, bạn muốn trang bị cho pipeline các trình chấm điểm khác ngoài accuracy, gồm roc_auc_score(), f1_score(), và chính hàm chấm điểm tự viết. Pipeline từ bài trước có sẵn dưới tên pipe, lưới tham số là params, và dữ liệu huấn luyện là X_train, y_train. Bạn cũng có confusion_matrix() để phục vụ việc viết metric riêng.

Hướng dẫn 1/3

undefined XP
  • 1

    Chuyển metric roc_auc_score() thành một scorer và truyền nó vào GridSearchCV(). Sau đó fit mô hình với dữ liệu.

  • 2

    Bây giờ lặp lại với F1 score, được tính bởi f1_score().

  • 3

    Tiếp tục lặp lại với một metric tùy chỉnh có sẵn dưới dạng một hàm Python đơn giản tên là my_metric().