1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Dự đoán CTR với Machine Learning trong Python

Connected

Bài tập

Khởi động so sánh mô hình

Trong bài tập này, bạn sẽ chạy một so sánh cơ bản về bốn loại kết quả giữa MLP và Random Forest bằng cách dùng ma trận nhầm lẫn (confusion matrix). Đây là bước chuẩn bị cho phần phân tích tất cả các mô hình mà chúng ta đã học. Thực hiện bài khởi động này sẽ giúp bạn so sánh cách triển khai các mô hình và cách đánh giá chúng cho bài toán dự đoán CTR.

Trong workspace, chúng ta đã có các tập train và test cho X và y lần lượt là X_train, X_test cho X và y_train, y_test cho y. Hãy nhớ, X chứa các đặc trưng đã được tạo thêm (engineered features) với thông tin người dùng, thiết bị và trang, còn y là biến mục tiêu (quảng cáo có được nhấp hay không). X đã được chuẩn hóa bằng StandardScaler(). Với các mô hình dự đoán CTR cho quảng cáo về sau, phần thiết lập sẽ tương tự.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Tạo một mô hình Random Forest, và một mô hình MLP với một tầng ẩn (dùng hidden_layer_sizes) gồm 10 đơn vị, và 40 vòng lặp tối đa (dùng max_iter).
  • Xem bốn loại kết quả thông qua confusion_matrix(y_test, y_pred) để so sánh chúng.