1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Lập trình song song với Dask trong Python

Connected

Bài tập

Chia train-test theo kiểu lười thực thi (lazy)

Bạn đã biến đổi các biến X. Giờ hãy hoàn tất bước chuẩn bị dữ liệu bằng cách biến đổi các biến y và chia dữ liệu thành tập train và test.

Các biến X và y mà bạn đã tạo ở bài tập trước hiện có sẵn trong môi trường của bạn.

Hướng dẫn

100 XP
  • Import hàm train_test_split() từ dask_ml.model_selection.
  • Điểm độ phổ biến trong y nằm trong khoảng 0-100, hãy chia cho 100 để đưa chúng về khoảng 0-1.
  • Chia dữ liệu thành tập train và test bằng hàm train_test_split(), nhớ xáo trộn (shuffle) dữ liệu và đặt tỷ lệ test là 20% dữ liệu.