Pembagian train-test secara lazy
Anda telah mentransformasi variabel X. Sekarang Anda perlu menyelesaikan penyiapan data dengan mentransformasi variabel y dan membagi data menjadi himpunan train dan test.
Variabel X dan y yang Anda buat pada latihan sebelumnya tersedia di lingkungan Anda.
Latihan ini adalah bagian dari kursus
Pemrograman Paralel dengan Dask di Python
Petunjuk latihan
- Impor fungsi
train_test_split()daridask_ml.model_selection. - Skor popularitas pada
yberada dalam rentang 0–100, bagilah dengan 100 sehingga berada dalam rentang 0–1. - Bagi data menjadi himpunan train dan test menggunakan fungsi
train_test_split(), pastikan untuk mengacak data, dan tetapkan fraksi test sebesar 20% dari data.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import the train_test_split function
from ____ import ____
# Rescale the target values
y = ____
# Split the data into train and test sets
X_train, X_test, y_train, y_test = ____
print(X_train)