Test kümesinde tahmin yap
Artık elinde rastgele bölünmüş bir eğitim ve test kümesi olduğuna göre, ilk egzersizde yaptığın gibi lm() fonksiyonunu kullanarak tüm veri kümesi yerine eğitim kümesine bir model uydurabilirsin. Doğrusal regresyon fonksiyonunun formül arayüzünü kullanarak, veri kümesindeki diğer tüm değişkenleri yordayıcı olarak alıp belirli bir hedef değişken için model kurabileceğini unutma:
mod <- lm(y ~ ., training_data)
Bu modelden yeni veriler için tahmin üretmek üzere predict() fonksiyonunu kullanabilirsin. Yeni veri kümesinde, eğitim verisindeki tüm sütunlar bulunmalı; ancak sıraları farklı olabilir ve değerleri farklıdır. Burada, eğitim kümesi üzerinde yeniden tahmin yapmak yerine, modeli eğitmek için kullanmadığın test kümesi üzerinde tahmin yapabilirsin. Bu, bir sonraki egzersizde modelin örneklem-dışı hatasını belirlemene olanak tanır:
p <- predict(model, new_data)
Bu egzersiz
R ile caret kullanarak Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
- Tüm diğer değişkenleri kovaryat olarak kullanarak
price'ı tahmin eden,modeladlı birlm()modeli kur. Mutlaka eğitim kümesini,train'i kullan. predict()ile test kümesitestüzerinde tahmin yap. Bu değerleripadlı bir vektörde sakla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Fit lm model on train: model
# Predict on test: p