Evaluasi lipatan
Sekarang setelah Anda melatih 10 model menggunakan semua 10 lipatan dan menghitung MAE serta RMSE untuk masing-masing model, saatnya memvisualisasikan seberapa besar galatnya. Dengan cara ini, Anda membangun intuisi tentang sebaran galat out-of-sample, yang membantu dalam menilai kualitas model Anda.
Anda akan memplot semua galat ini sebagai histogram dan menampilkan statistik ringkasan di seluruh lipatan.
Hasil dari latihan sebelumnya, fits_cv, sudah dimuat.
Latihan ini adalah bagian dari kursus
Machine Learning dengan Model Berbasis Pohon di R
Petunjuk latihan
- Kumpulkan galat out-of-sample dari semua model dalam
fits_cvmenggunakan satu fungsiyardstickdan simpan sebagaiall_errors. - Buat histogram
ggplot2dengan.estimatesebagai estetikaxdanfillbatang berdasarkan.metric. - Gunakan fungsi yang sama seperti pada instruksi pertama dengan
summarize = TRUEuntuk menampilkan statistik ringkasan darifits_cv.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
library(ggplot2)
# Collect the errors
all_errors <- ___(___, summarize = ___)
# Plot an error histogram
ggplot(___, aes(___, ___)) +
___()
# Collect and print error statistics
___(fits_cv, ___)