Kinerja in-sample
Sangat penting untuk mengetahui apakah model regresi Anda bermanfaat atau tidak. Model yang bermanfaat bisa jadi adalah model yang mampu menangkap struktur himpunan latih dengan baik. Salah satu cara menilai kinerja in-sample adalah dengan memprediksi pada data pelatihan dan menghitung mean absolute error dari seluruh titik data yang diprediksi.
Pada latihan ini, Anda akan mengevaluasi prediksi in-sample menggunakan MAE (mean absolute error). MAE memberi tahu Anda seberapa jauh, secara kasar, prediksi dari nilai sebenarnya.
MAE dihitung menggunakan rumus berikut, di mana \(n\) adalah jumlah prediksi yang dibuat:
$$MAE = \frac{1}{n} \cdot \sum_{i=1}^n \text{absolute value of the }i\text{th error}$$
Di ruang kerja Anda tersedia model, yaitu regression tree yang Anda bangun pada latihan sebelumnya.
Latihan ini adalah bagian dari kursus
Machine Learning dengan Model Berbasis Pohon di R
Petunjuk latihan
- Buat
in_sample_predictionsdengan menggunakanmodeluntuk memprediksi pada tibblechocolate_train. - Hitung vektor
abs_diffsyang berisi selisih absolut antara prediksi in-sample dan nilai akhir yang sebenarnya. - Hitung mean absolute error sesuai rumus di atas.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Predict using the training set
in_sample_predictions <- predict(model,
___)
# Calculate the vector of absolute differences
abs_diffs <- ___(__$___ - ___$___)
# Calculate the mean absolute error
1 / ___ * ___