MulaiMulai sekarang secara gratis

Menggunakan indeks KFold

Anda sudah membuat splits, yang memuat indeks untuk himpunan data candy-data guna menyelesaikan cross-validation 5-fold. Untuk mendapatkan perkiraan yang lebih baik tentang seberapa baik model random forest milik rekan kerja akan bekerja pada data baru, Anda ingin menjalankan model ini pada lima indeks pelatihan dan validasi yang baru saja Anda buat.

Dalam latihan ini, Anda akan menggunakan indeks tersebut untuk memeriksa akurasi model dengan lima pembagian yang berbeda. Sebuah for loop telah disediakan untuk membantu proses ini.

Latihan ini adalah bagian dari kursus

Validasi Model di Python

Lihat Kursus

Petunjuk latihan

  • Gunakan train_index dan val_index untuk memanggil indeks yang benar dari X dan y saat membuat data pelatihan dan validasi.
  • Lakukan fitting rfc menggunakan himpunan data pelatihan
  • Gunakan rfc untuk membuat prediksi pada himpunan data validasi dan cetak akurasi validasi

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error

rfc = RandomForestRegressor(n_estimators=25, random_state=1111)

# Access the training and validation indices of splits
for train_index, val_index in splits:
    # Setup the training and validation data
    X_train, y_train = X[____], y[____]
    X_val, y_val = X[____], y[____]
    # Fit the random forest model
    rfc.____(____, ____)
    # Make predictions, and print the accuracy
    predictions = rfc.____(____)
    print("Split accuracy: " + str(mean_squared_error(y_val, predictions)))
Edit dan Jalankan Kode