1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning cho Marketing với Python

Connected

Bài tập

Chia dữ liệu thành huấn luyện và kiểm tra

Giờ bạn đã sẵn sàng xây dựng một mô hình Machine Learning end-to-end chỉ với vài bước đơn giản! Bạn sẽ khám phá chi tiết hơn các sắc thái trong mô hình ở các chương tiếp theo, còn hiện tại hãy luyện tập và nắm các bước chính.

Các đặc trưng độc lập đã được nạp sẵn dưới dạng pandas DataFrame tên là X, và các giá trị phụ thuộc dưới dạng pandas Series tên là Y.

Ngoài ra, hàm train_test_split từ thư viện sklearn cũng đã được nạp. Bây giờ bạn sẽ tạo tập dữ liệu huấn luyện và kiểm tra, rồi xác nhận rằng dữ liệu đã được chia đúng.

Hướng dẫn

100 XP
  • Chia X và Y thành các tập train và test với 25% dữ liệu dành cho kiểm tra.
  • Đảm bảo tập huấn luyện chỉ chiếm 75% dữ liệu gốc.
  • Đảm bảo tập kiểm tra chỉ chiếm 25% dữ liệu gốc.