Kesalahan lebih besar, penalti lebih besar
Semua kesalahan tetaplah salah, tetapi tidak semuanya sama buruknya. Terkadang kesalahan prediksi yang besar jauh lebih merugikan daripada kesalahan kecil.
Kesalahan lebih besar, penalti lebih besar — itulah salah satu karakteristik root mean squared error atau RMSE. Ukuran ini mengkuadratkan kesalahan besar, sehingga menghukum pencilan tersebut lebih berat dibandingkan kesalahan yang lebih kecil.
RMSE dapat dihitung menggunakan rumus berikut, di mana squared_diff ke-\(i\) adalah kuadrat dari galat ke-\(i\).
$$RMSE = \sqrt{\frac{1}{n} \cdot \sum_{i=1} ^n i\text{th squared_diff}}$$
Dalam latihan ini, Anda akan menghitung RMSE dari prediksi Anda.
Di workspace Anda tersedia hasil dari latihan sebelumnya, test_enriched, yaitu data uji dengan kolom baru .pred, prediksi model di luar sampel.
Latihan ini adalah bagian dari kursus
Machine Learning dengan Model Berbasis Pohon di R
Petunjuk latihan
- Hitung selisih per komponen antara prediksi dan nilai akhir, kuadratkan, lalu simpan sebagai
squared_diffs. - Gunakan rumus di atas untuk menghitung RMSE dan simpan sebagai
rmse_manual. - Gunakan fungsi
rmse()untuk menghitung galat dan simpan sebagairmse_auto. - Cetak
rmse_manualdanrmse_autountuk memverifikasi bahwa nilainya sama.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Calculate the squared differences
squared_diffs <- (___ - ___)^___
# Compute the RMSE using the formula
rmse_manual <- ___(1 / ___ * ___)
# Compute the RMSE using a function
rmse_auto <- ___(___,
___,
___)
# Print both errors
___
___