Kinerja in-sample dan out-of-sample
Apakah model yang lebih canggih selalu berkinerja lebih baik? Seperti dibahas dalam video, itu hanya setengah dari kebenaran.
Model yang overfitting memahami struktur himpunan latihnya dengan sempurna tetapi tidak dapat melakukan generalisasi ke data baru. Cukup mengecewakan! Pada akhirnya, tujuan utama model prediktif adalah berkinerja baik pada data baru, bukan? Silakan selidiki!
Telah dimuat sebelumnya model terakhir dari latihan sebelumnya, complex_model, serta data latih dan uji Anda (chocolate_train dan chocolate_test).
Latihan ini adalah bagian dari kursus
Machine Learning dengan Model Berbasis Pohon di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Predict on and combine with training data and calculate the error
predict(___, new_data = ___) %>%
___ %>%
mae(___,
___)