Menggunakan indeks KFold
Anda sudah membuat splits, yang memuat indeks untuk himpunan data candy-data guna menyelesaikan cross-validation 5-fold. Untuk mendapatkan perkiraan yang lebih baik tentang seberapa baik model random forest milik rekan kerja akan bekerja pada data baru, Anda ingin menjalankan model ini pada lima indeks pelatihan dan validasi yang baru saja Anda buat.
Dalam latihan ini, Anda akan menggunakan indeks tersebut untuk memeriksa akurasi model dengan lima pembagian yang berbeda. Sebuah for loop telah disediakan untuk membantu proses ini.
Latihan ini adalah bagian dari kursus
Validasi Model di Python
Petunjuk latihan
- Gunakan
train_indexdanval_indexuntuk memanggil indeks yang benar dariXdanysaat membuat data pelatihan dan validasi. - Lakukan fitting
rfcmenggunakan himpunan data pelatihan - Gunakan
rfcuntuk membuat prediksi pada himpunan data validasi dan cetak akurasi validasi
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error
rfc = RandomForestRegressor(n_estimators=25, random_state=1111)
# Access the training and validation indices of splits
for train_index, val_index in splits:
# Setup the training and validation data
X_train, y_train = X[____], y[____]
X_val, y_val = X[____], y[____]
# Fit the random forest model
rfc.____(____, ____)
# Make predictions, and print the accuracy
predictions = rfc.____(____)
print("Split accuracy: " + str(mean_squared_error(y_val, predictions)))