1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Dự đoán CTR với Machine Learning trong Python

Connected

Bài tập

Đánh giá bốn loại kết quả

Ma trận nhầm lẫn là công cụ trực quan nhất để xem bốn loại kết quả: true positives (TP), false positives (FP), true negatives (TN), và false negatives (FN). Trong bài tập này, bạn sẽ dùng bộ phân loại cây quyết định tiêu chuẩn DecisionTreeClassifier() từ sklearn trên dữ liệu click mẫu và tính các phân tách kết quả theo bốn loại.

Mô-đun pandas đã có sẵn với bí danh pd trong không gian làm việc và DataFrame mẫu đã được nạp dưới tên df. Các đặc trưng đã được nạp vào X và mục tiêu đã được nạp vào y để sử dụng. Ngoài ra, DecisionTreeClassifier từ sklearn.tree cũng sẵn có.

Hướng dẫn

100 XP
  • Tạo các tập huấn luyện và kiểm tra cho X và y.
  • Định nghĩa một bộ phân loại cây quyết định và tạo dự đoán y_pred bằng cách fit mô hình.
  • Dùng ma trận nhầm lẫn để lấy số đếm cho từng loại kết quả, với 1 là dương (click) và 0 là âm (không click).
  • Ví dụ: true negatives là [0,0] và true positives là [1,1].