MulaiMulai sekarang secara gratis

Prediksi pada himpunan uji

Sekarang setelah Anda memiliki himpunan latih dan himpunan uji yang dipisah secara acak, Anda dapat menggunakan fungsi lm() seperti pada latihan pertama untuk menyesuaikan model pada himpunan latih, alih-alih seluruh himpunan data. Ingat bahwa Anda dapat menggunakan antarmuka formula pada fungsi regresi linear untuk menyesuaikan model dengan variabel target tertentu menggunakan semua variabel lain dalam himpunan data sebagai prediktor:

mod <- lm(y ~ ., training_data)

Anda dapat menggunakan fungsi predict() untuk membuat prediksi dari model tersebut pada data baru. Himpunan data baru harus memiliki semua kolom dari data latih, tetapi urutan kolom dan nilainya boleh berbeda. Di sini, alih-alih memprediksi ulang pada himpunan latih, Anda dapat melakukan prediksi pada himpunan uji, yang tidak Anda gunakan untuk melatih model. Ini akan memungkinkan Anda menentukan galat di luar sampel untuk model pada latihan berikutnya:

p <- predict(model, new_data)

Latihan ini adalah bagian dari kursus

Machine Learning dengan caret di R

Lihat Kursus

Petunjuk latihan

  • Sesuaikan model lm() bernama model untuk memprediksi price menggunakan semua variabel lain sebagai kovariat. Pastikan menggunakan himpunan latih, train.
  • Lakukan prediksi pada himpunan uji, test, menggunakan predict(). Simpan nilai-nilai ini dalam sebuah vektor bernama p.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Fit lm model on train: model


# Predict on test: p
Edit dan Jalankan Kode