Prediksi pada himpunan uji
Sekarang setelah Anda memiliki himpunan latih dan himpunan uji yang dipisah secara acak, Anda dapat menggunakan fungsi lm() seperti pada latihan pertama untuk menyesuaikan model pada himpunan latih, alih-alih seluruh himpunan data. Ingat bahwa Anda dapat menggunakan antarmuka formula pada fungsi regresi linear untuk menyesuaikan model dengan variabel target tertentu menggunakan semua variabel lain dalam himpunan data sebagai prediktor:
mod <- lm(y ~ ., training_data)
Anda dapat menggunakan fungsi predict() untuk membuat prediksi dari model tersebut pada data baru. Himpunan data baru harus memiliki semua kolom dari data latih, tetapi urutan kolom dan nilainya boleh berbeda. Di sini, alih-alih memprediksi ulang pada himpunan latih, Anda dapat melakukan prediksi pada himpunan uji, yang tidak Anda gunakan untuk melatih model. Ini akan memungkinkan Anda menentukan galat di luar sampel untuk model pada latihan berikutnya:
p <- predict(model, new_data)
Latihan ini adalah bagian dari kursus
Machine Learning dengan caret di R
Petunjuk latihan
- Sesuaikan model
lm()bernamamodeluntuk memprediksipricemenggunakan semua variabel lain sebagai kovariat. Pastikan menggunakan himpunan latih,train. - Lakukan prediksi pada himpunan uji,
test, menggunakanpredict(). Simpan nilai-nilai ini dalam sebuah vektor bernamap.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Fit lm model on train: model
# Predict on test: p