1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích Marketing: Dự đoán Khách hàng Rời bỏ bằng Python

Connected

Bài tập

Điểm F1

Như bạn đã thấy, luôn có sự đánh đổi giữa precision và recall. Cả hai đều là chỉ số quan trọng, và tùy vào cách doanh nghiệp muốn mô hình hóa churn, bạn có thể ưu tiên tối ưu hóa chỉ số này hơn chỉ số kia. Thường thì các bên liên quan muốn có một chỉ số duy nhất để định lượng hiệu suất mô hình. AUC là một chỉ số dùng cho tình huống này, và một chỉ số khác là F1 score, được tính như sau:

2 * (precision * recall) / (precision + recall)

Ưu điểm của F1 score là gộp cả precision và recall vào một chỉ số duy nhất; F1 score cao cho thấy mô hình hoạt động tốt, ngay cả khi bạn có phân lớp mất cân bằng. Trong scikit-learn, bạn có thể tính F1 score bằng hàm f1_score.

Hướng dẫn

100 XP
  • Import f1_score từ sklearn.metrics.
  • In ra F1 score của mô hình random forest đã huấn luyện.