MulaiMulai sekarang secara gratis

Leave-one-out-cross-validation

Misalkan permen favorit Anda tidak ada di himpunan data permen, dan Anda ingin mengetahui popularitas permen tersebut. Menggunakan validasi silang 5-fold hanya akan melatih 80% data setiap kali. Namun, himpunan data permen hanya memiliki 85 baris, dan mengeluarkan 20% data dapat menghambat kinerja model. Dengan leave-one-out-cross-validation, kita dapat memaksimalkan himpunan data yang terbatas dan memperoleh estimasi terbaik untuk popularitas permen favorit Anda!

Dalam latihan ini, Anda akan menggunakan cross_val_score() untuk melakukan LOOCV.

Latihan ini adalah bagian dari kursus

Validasi Model di Python

Lihat Kursus

Petunjuk latihan

  • Buat sebuah scorer menggunakan mean_absolute_error untuk digunakan oleh cross_val_score().
  • Lengkapi cross_val_score() sehingga menggunakan model rfr, mae_scorer yang baru didefinisikan, dan LOOCV.
  • Cetak nilai mean dan standar deviasi dari scores menggunakan numpy (diimpor sebagai np).

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

from sklearn.metrics import mean_absolute_error, make_scorer

# Create scorer
mae_scorer = ____(____)

rfr = RandomForestRegressor(n_estimators=15, random_state=1111)

# Implement LOOCV
scores = cross_val_score(____, X=X, y=y, cv=____, scoring=____)

# Print the mean and standard deviation
print("The mean of the errors is: %s." % np.____(____))
print("The standard deviation of the errors is: %s." % np.____(____))
Edit dan Jalankan Kode