MulaiMulai sekarang secara gratis

Pembagian train-test secara lazy

Anda telah mentransformasi variabel X. Sekarang Anda perlu menyelesaikan penyiapan data dengan mentransformasi variabel y dan membagi data menjadi himpunan train dan test.

Variabel X dan y yang Anda buat pada latihan sebelumnya tersedia di lingkungan Anda.

Latihan ini adalah bagian dari kursus

Pemrograman Paralel dengan Dask di Python

Lihat Kursus

Petunjuk latihan

  • Impor fungsi train_test_split() dari dask_ml.model_selection.
  • Skor popularitas pada y berada dalam rentang 0–100, bagilah dengan 100 sehingga berada dalam rentang 0–1.
  • Bagi data menjadi himpunan train dan test menggunakan fungsi train_test_split(), pastikan untuk mengacak data, dan tetapkan fraksi test sebesar 20% dari data.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import the train_test_split function
from ____ import ____

# Rescale the target values
y = ____

# Split the data into train and test sets
X_train, X_test, y_train, y_test = ____

print(X_train)
Edit dan Jalankan Kode