Test kümesinde tahmin yap
Artık elinde rastgele bölünmüş bir eğitim ve test kümesi olduğuna göre, ilk egzersizde yaptığın gibi lm() fonksiyonunu kullanarak tüm veri kümesi yerine eğitim kümesine bir model uydurabilirsin. Doğrusal regresyon fonksiyonunun formül arayüzünü kullanarak, veri kümesindeki diğer tüm değişkenleri yordayıcı olarak alıp belirli bir hedef değişken için model kurabileceğini unutma:
mod <- lm(y ~ ., training_data)
Bu modelden yeni veriler için tahmin üretmek üzere predict() fonksiyonunu kullanabilirsin. Yeni veri kümesinde, eğitim verisindeki tüm sütunlar bulunmalı; ancak sıraları farklı olabilir ve değerleri farklıdır. Burada, eğitim kümesi üzerinde yeniden tahmin yapmak yerine, modeli eğitmek için kullanmadığın test kümesi üzerinde tahmin yapabilirsin. Bu, bir sonraki egzersizde modelin örneklem-dışı hatasını belirlemene olanak tanır:
p <- predict(model, new_data)
Bu egzersiz, kursun bir parçasıdır
R ile caret kullanarak Machine Learning
Egzersiz talimatları
- Tüm diğer değişkenleri kovaryat olarak kullanarak
price'ı tahmin eden,modeladlı birlm()modeli kur. Mutlaka eğitim kümesini,train'i kullan. predict()ile test kümesitestüzerinde tahmin yap. Bu değerleripadlı bir vektörde sakla.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Fit lm model on train: model
# Predict on test: p