Inisialisasi model
Dalam rangkaian latihan berikut, Anda akan mendiagnosis masalah bias dan varians pada sebuah pohon regresi. Pohon regresi yang akan Anda definisikan pada latihan ini akan digunakan untuk memprediksi konsumsi mpg mobil dari himpunan data auto dengan menggunakan semua fitur yang tersedia.
Kami telah memproses data dan memuat matriks fitur X serta array y ke dalam ruang kerja Anda. Selain itu, kelas DecisionTreeRegressor telah diimpor dari sklearn.tree.
Latihan ini adalah bagian dari kursus
Machine Learning dengan Model Berbasis Pohon di Python
Petunjuk latihan
- Impor
train_test_splitdarisklearn.model_selection. - Bagi data menjadi 70% latih dan 30% uji.
- Inisialisasi
DecisionTreeRegressordengan kedalaman maksimum 4 danmin_samples_leafdisetel ke 0.26.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import train_test_split from sklearn.model_selection
____
# Set SEED for reproducibility
SEED = 1
# Split the data into 70% train and 30% test
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=SEED)
# Instantiate a DecisionTreeRegressor dt
dt = ____(____=____, ____=____, random_state=SEED)