1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning cho Marketing với Python

Connected

Bài tập

Khám phá tỷ lệ churn và tách dữ liệu

Tiếp nối phần tổng quan bạn đã xem ở Chương 1, trong bài học này, bạn sẽ đi sâu hơn vào bước chuẩn bị dữ liệu cần thiết để dùng Machine Learning dự đoán churn. Bạn sẽ khám phá phân phối churn và tách dữ liệu thành train và test trước khi bước vào mô hình hóa. Ở bước này, bạn sẽ hiểu cách tỷ lệ churn được phân bố, và tiền xử lý dữ liệu để có thể xây dựng mô hình trên tập huấn luyện, đồng thời đo lường hiệu năng trên tập kiểm tra chưa dùng đến.

Bộ dữ liệu viễn thông đã được nạp dưới dạng pandas DataFrame tên là telcom. Cột biến mục tiêu có tên Churn.

Hướng dẫn

100 XP
  • In ra các giá trị duy nhất trong cột Churn.
  • Tính tỷ lệ kích thước của mỗi nhóm churn.
  • Import hàm để tách dữ liệu thành train và test.
  • Tách dữ liệu thành 75% train và 25% test.