1. Learn
  2. /
  3. Courses
  4. /
  5. Giới thiệu về Hồi quy với statsmodels trong Python

Connected

Exercise

Tính ma trận nhầm lẫn

Một ma trận nhầm lẫn (đôi khi gọi là bảng nhầm lẫn) là nền tảng của mọi chỉ số đánh giá hiệu năng cho các mô hình có biến phản hồi phân loại (như logistic regression). Ma trận này chứa số đếm của từng cặp phản hồi thực tế - phản hồi dự đoán. Trong trường hợp này, khi có hai khả năng phản hồi (rời đi hoặc không rời đi), sẽ có bốn kết cục tổng thể.

  1. Dương tính thật: Khách hàng đã rời đi và mô hình dự đoán đúng là sẽ rời đi.
  2. Dương tính giả: Khách hàng không rời đi, nhưng mô hình dự đoán sẽ rời đi.
  3. Âm tính thật: Khách hàng không rời đi và mô hình dự đoán đúng là sẽ không rời đi.
  4. Âm tính giả: Khách hàng đã rời đi, nhưng mô hình dự đoán là sẽ không rời đi.

churn và mdl_churn_vs_relationship đã được cung cấp.

Instructions

100 XP
  • Lấy phản hồi thực tế bằng cách chọn cột has_churned của tập dữ liệu. Gán vào actual_response.
  • Lấy phản hồi dự đoán "có khả năng nhất" từ mô hình. Gán vào predicted_response.
  • Tạo một DataFrame từ actual_response và predicted_response. Gán vào outcomes.
  • In outcomes dưới dạng bảng số đếm, biểu diễn ma trận nhầm lẫn. Phần này đã được làm sẵn cho bạn.