1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning cho Marketing với Python

Connected

Bài tập

Dự đoán churn với cây quyết định

Bây giờ, bạn sẽ tiếp tục từ kỹ năng đã học ở bài trước và xây dựng một cây quyết định phức tạp hơn với các tham số bổ sung để dự đoán việc khách hàng rời bỏ (churn). Bạn sẽ đi sâu vào bài toán dự đoán churn ở chương kế tiếp. Ở đây, bạn sẽ chạy lại bộ phân loại cây quyết định trên dữ liệu huấn luyện, dự đoán tỷ lệ churn trên dữ liệu chưa thấy (kiểm tra), và đánh giá độ chính xác của mô hình trên cả hai tập dữ liệu.

Mô-đun tree từ thư viện sklearn đã được nạp sẵn cho bạn, cùng với hàm accuracy_score từ sklearn.metrics. Các biến đặc trưng và mục tiêu cũng đã được nhập dưới dạng train_X, train_Y cho dữ liệu huấn luyện, và test_X, test_Y cho dữ liệu kiểm tra.

Hướng dẫn

100 XP
  • Khởi tạo một cây quyết định với độ sâu tối đa là 7 và dùng tiêu chí gini.
  • Fit mô hình với dữ liệu huấn luyện.
  • Dự đoán giá trị trên tập dữ liệu kiểm tra.
  • In ra độ chính xác cho cả hai tập dữ liệu huấn luyện và kiểm tra.