1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning cho Marketing với Python

Connected

Bài tập

Chia dữ liệu thành huấn luyện và kiểm tra

Bước cuối cùng trước khi chuyển sang xây dựng mô hình hồi quy! Tại đây, bạn sẽ lần lượt xác định tên của biến mục tiêu và các cột đặc trưng, trích xuất dữ liệu, rồi chia thành tập huấn luyện và kiểm tra.

Thư viện pandas và numpy đã được nạp với bí danh lần lượt là pd và np. Các đặc trưng đầu vào đã được nhập dưới dạng bộ dữ liệu features, và biến mục tiêu bạn đã xây dựng ở bài trước đã được nhập sẵn cho bạn dưới tên Y.

Hướng dẫn

100 XP
  • Lưu tên cột định danh khách hàng dưới dạng một danh sách.
  • Chọn các tên cột đặc trưng, loại trừ cột định danh khách hàng.
  • Trích xuất các đặc trưng thành X.
  • Chia dữ liệu thành huấn luyện và kiểm tra bằng hàm train_test_split().