MulaiMulai sekarang secara gratis

Evaluasi lipatan

Sekarang setelah Anda melatih 10 model menggunakan semua 10 lipatan dan menghitung MAE serta RMSE untuk masing-masing model, saatnya memvisualisasikan seberapa besar galatnya. Dengan cara ini, Anda membangun intuisi tentang sebaran galat out-of-sample, yang membantu dalam menilai kualitas model Anda.

Anda akan memplot semua galat ini sebagai histogram dan menampilkan statistik ringkasan di seluruh lipatan.

Hasil dari latihan sebelumnya, fits_cv, sudah dimuat.

Latihan ini adalah bagian dari kursus

Machine Learning dengan Model Berbasis Pohon di R

Lihat Kursus

Petunjuk latihan

  • Kumpulkan galat out-of-sample dari semua model dalam fits_cv menggunakan satu fungsi yardstick dan simpan sebagai all_errors.
  • Buat histogram ggplot2 dengan .estimate sebagai estetika x dan fill batang berdasarkan .metric.
  • Gunakan fungsi yang sama seperti pada instruksi pertama dengan summarize = TRUE untuk menampilkan statistik ringkasan dari fits_cv.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

library(ggplot2)

# Collect the errors
all_errors <- ___(___, summarize = ___)

# Plot an error histogram
ggplot(___, aes(___, ___)) +
        ___()

# Collect and print error statistics
___(fits_cv, ___)
Edit dan Jalankan Kode