MulaiMulai sekarang secara gratis

RMSE in-sample untuk regresi linear pada diamonds

Seperti yang Anda lihat di video, kursus ini menyertakan himpunan data diamonds, yang merupakan himpunan data klasik dari paket ggplot2. Himpunan data ini memuat atribut fisik berlian serta harga jualnya. Salah satu tantangan pemodelan yang menarik adalah memprediksi harga berlian berdasarkan atributnya menggunakan sesuatu seperti regresi linear.

Ingat bahwa untuk menyesuaikan regresi linear, Anda menggunakan fungsi lm() dengan format berikut:

mod <- lm(y ~ x, my_data)

Untuk membuat prediksi menggunakan mod pada data asli, Anda memanggil fungsi predict():

pred <- predict(mod, my_data)

Latihan ini adalah bagian dari kursus

Machine Learning dengan caret di R

Lihat Kursus

Petunjuk latihan

  • Sesuaikan model linear pada himpunan data diamonds untuk memprediksi price dengan menggunakan semua variabel lain sebagai prediktor (yaitu price ~ .). Simpan hasilnya ke model.
  • Buat prediksi menggunakan model pada seluruh himpunan data asli dan simpan hasilnya ke p.
  • Hitung galat menggunakan rumus \(errors = predicted - actual\). Simpan hasilnya ke error.
  • Hitung RMSE menggunakan rumus yang Anda pelajari di video dan cetak ke konsol.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Fit lm model: model


# Predict on full data: p


# Compute errors: error


# Calculate RMSE
Edit dan Jalankan Kode