RMSE in-sample untuk regresi linear pada diamonds
Seperti yang Anda lihat di video, kursus ini menyertakan himpunan data diamonds, yang merupakan himpunan data klasik dari paket ggplot2. Himpunan data ini memuat atribut fisik berlian serta harga jualnya. Salah satu tantangan pemodelan yang menarik adalah memprediksi harga berlian berdasarkan atributnya menggunakan sesuatu seperti regresi linear.
Ingat bahwa untuk menyesuaikan regresi linear, Anda menggunakan fungsi lm() dengan format berikut:
mod <- lm(y ~ x, my_data)
Untuk membuat prediksi menggunakan mod pada data asli, Anda memanggil fungsi predict():
pred <- predict(mod, my_data)
Latihan ini adalah bagian dari kursus
Machine Learning dengan caret di R
Petunjuk latihan
- Sesuaikan model linear pada himpunan data
diamondsuntuk memprediksipricedengan menggunakan semua variabel lain sebagai prediktor (yaituprice ~ .). Simpan hasilnya kemodel. - Buat prediksi menggunakan
modelpada seluruh himpunan data asli dan simpan hasilnya kep. - Hitung galat menggunakan rumus \(errors = predicted - actual\). Simpan hasilnya ke
error. - Hitung RMSE menggunakan rumus yang Anda pelajari di video dan cetak ke konsol.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Fit lm model: model
# Predict on full data: p
# Compute errors: error
# Calculate RMSE