Hitung RMSE
Dalam latihan ini, Anda akan menghitung RMSE dari model pengangguran Anda. Pada latihan pemrograman sebelumnya,
Anda menambahkan dua kolom ke himpunan data unemployment:
- prediksi model (kolom
predictions) - residual antara prediksi dan keluaran (kolom
residuals)
Anda dapat menghitung RMSE dari sebuah vektor residual, \(res\), sebagai:
$$ RMSE = \sqrt{\operatorname{mean}(res^2)} $$
Anda menginginkan RMSE yang kecil. Seberapa kecil itu? Salah satu heuristik adalah membandingkan RMSE dengan simpangan baku dari keluaran. Dengan model yang baik, RMSE seharusnya lebih kecil.
Kerangka data unemployment telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Supervised Learning di R: Regresi
Petunjuk latihan
- Tinjau data
unemploymentdari latihan sebelumnya. - Untuk kemudahan, tetapkan kolom
residualsdariunemploymentke variabelres. - Hitung RMSE: kuadratkan
res, ambil nilai rataratanya, lalu akarkan. Tetapkan hasilnya ke variabelrmsedan cetak.- Tip: Anda dapat melakukannya dalam satu langkah dengan membungkus penetapan dalam tanda kurung:
(rmse <- ___)
- Tip: Anda dapat melakukannya dalam satu langkah dengan membungkus penetapan dalam tanda kurung:
- Hitung simpangan baku dari
female_unemploymentdan tetapkan ke variabelsd_unemployment. Cetak. Bagaimana perbandingan rmse model terhadap simpangan baku data?
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Print a summary of unemployment
summary(unemployment)
# For convenience put the residuals in the variable res
res <- ___
# Calculate RMSE, assign it to the variable rmse and print it
(rmse <- ___)
# Calculate the standard deviation of female_unemployment and print it
(sd_unemployment <- ___)