Prediksi pada himpunan uji
Sekarang setelah Anda memiliki himpunan latih dan himpunan uji yang dipisah secara acak, Anda dapat menggunakan fungsi lm() seperti pada latihan pertama untuk menyesuaikan model pada himpunan latih, alih-alih seluruh himpunan data. Ingat bahwa Anda dapat menggunakan antarmuka formula pada fungsi regresi linear untuk menyesuaikan model dengan variabel target tertentu menggunakan semua variabel lain dalam himpunan data sebagai prediktor:
mod <- lm(y ~ ., training_data)
Anda dapat menggunakan fungsi predict() untuk membuat prediksi dari model tersebut pada data baru. Himpunan data baru harus memiliki semua kolom dari data latih, tetapi urutan kolom dan nilainya boleh berbeda. Di sini, alih-alih memprediksi ulang pada himpunan latih, Anda dapat melakukan prediksi pada himpunan uji, yang tidak Anda gunakan untuk melatih model. Ini akan memungkinkan Anda menentukan galat di luar sampel untuk model pada latihan berikutnya:
p <- predict(model, new_data)
Latihan ini merupakan bagian dari kursus
Machine Learning dengan caret di R
Instruksi latihan
- Sesuaikan model
lm()bernamamodeluntuk memprediksipricemenggunakan semua variabel lain sebagai kovariat. Pastikan menggunakan himpunan latih,train. - Lakukan prediksi pada himpunan uji,
test, menggunakanpredict(). Simpan nilai-nilai ini dalam sebuah vektor bernamap.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Fit lm model on train: model
# Predict on test: p