1. 学ぶ
  2. /
  3. コース
  4. /
  5. Phân tích Marketing: Dự đoán Khách hàng Rời bỏ bằng Python

Connected

演習

Ma trận nhầm lẫn

Sử dụng hàm confusion_matrix() của scikit-learn, bạn có thể dễ dàng tạo ma trận nhầm lẫn cho bộ phân loại của mình và hiểu sâu hơn về hiệu suất của nó. Hàm này nhận hai đối số: Nhãn thực tế của tập kiểm tra - y_test - và các nhãn dự đoán của bạn.

Các nhãn dự đoán từ bộ phân loại Random Forest ở bài trước được lưu trong y_pred và được tính như sau:

y_pred = clf.predict(X_test)

Lưu ý quan trọng: Mặc định sklearn tính ma trận nhầm lẫn như sau:

Screenshot 2019-05-13 05.59.04.png

Lưu ý rằng các trục bị đảo so với những gì bạn thấy trong video. Bản thân các chỉ số vẫn giữ nguyên, nhưng hãy ghi nhớ điều này khi diễn giải bảng.

指示1 / 3

undefined XP
    1
    2
    3
  • Import confusion_matrix từ sklearn.metrics.