Leave-one-out-cross-validation
Misalkan permen favorit Anda tidak ada di himpunan data permen, dan Anda ingin mengetahui popularitas permen tersebut. Menggunakan validasi silang 5-fold hanya akan melatih 80% data setiap kali. Namun, himpunan data permen hanya memiliki 85 baris, dan mengeluarkan 20% data dapat menghambat kinerja model. Dengan leave-one-out-cross-validation, kita dapat memaksimalkan himpunan data yang terbatas dan memperoleh estimasi terbaik untuk popularitas permen favorit Anda!
Dalam latihan ini, Anda akan menggunakan cross_val_score() untuk melakukan LOOCV.
Latihan ini adalah bagian dari kursus
Validasi Model di Python
Petunjuk latihan
- Buat sebuah scorer menggunakan
mean_absolute_erroruntuk digunakan olehcross_val_score(). - Lengkapi
cross_val_score()sehingga menggunakan modelrfr,mae_scoreryang baru didefinisikan, dan LOOCV. - Cetak nilai mean dan standar deviasi dari
scoresmenggunakannumpy(diimpor sebagainp).
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
from sklearn.metrics import mean_absolute_error, make_scorer
# Create scorer
mae_scorer = ____(____)
rfr = RandomForestRegressor(n_estimators=15, random_state=1111)
# Implement LOOCV
scores = cross_val_score(____, X=X, y=y, cv=____, scoring=____)
# Print the mean and standard deviation
print("The mean of the errors is: %s." % np.____(____))
print("The standard deviation of the errors is: %s." % np.____(____))