1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích Marketing: Dự đoán Khách hàng Rời bỏ bằng Python

Connected

Bài tập

Thay đổi kích thước tập huấn luyện

Kích thước của tập huấn luyện và kiểm tra ảnh hưởng đến hiệu suất mô hình. Mô hình học tốt hơn khi có nhiều dữ liệu huấn luyện. Tuy nhiên, có rủi ro là mô hình bị overfit vào dữ liệu huấn luyện và không tổng quát hóa tốt cho dữ liệu mới, vì vậy để đánh giá đúng khả năng tổng quát hóa của mô hình, bạn cần đủ dữ liệu kiểm tra. Do đó, luôn tồn tại một sự cân bằng và đánh đổi quan trọng giữa lượng dữ liệu dùng để huấn luyện và lượng giữ lại để kiểm tra.

Cho đến giờ, bạn đã dùng 70% để huấn luyện và 30% để kiểm tra. Bây giờ hãy dùng 80% dữ liệu để huấn luyện và đánh giá xem điều đó làm thay đổi hiệu suất mô hình như thế nào.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Tạo các tập huấn luyện và kiểm tra, với 80% dữ liệu dùng để huấn luyện và 20% giữ lại để kiểm tra.