1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Dự đoán CTR với Machine Learning trong Python

Connected

Bài tập

Đường cơ sở (Baseline)

Đánh giá một bộ phân loại so với một đường cơ sở phù hợp là rất quan trọng. Điều này càng đúng với các tập dữ liệu mất cân bằng, như click quảng cáo, vì độ chính xác (accuracy) cao có thể dễ dàng đạt được bằng cách luôn chọn lớp chiếm đa số. Trong bài này, bạn sẽ mô phỏng một bộ phân loại đường cơ sở luôn dự đoán lớp chiếm đa số (không click) và xem ma trận nhầm lẫn (confusion matrix) của nó, cũng như precision và recall của nó.

X_train, y_train, X_test, y_test đã có sẵn trong workspace của bạn. pandas là pd, numpy là np, và sklearn cũng đã sẵn sàng trong workspace.

Hướng dẫn

100 XP
  • Tạo y_pred là một mảng toàn số 0 có cùng độ dài với X_test bằng np.asarray().
  • In ma trận nhầm lẫn thu được.
  • Lấy điểm precision và recall.