En iyi modeli kur ve değerlendir
Çapraz doğrulama kullanarak, gapminder içindeki tüm özelliklerle life_expectancy tahmini için en iyi modeli belirledin. Artık modelini seçtiğine göre, ayırdığın bağımsız veri kümesini (testing_data) kullanarak bu modelin yeni verilerdeki performansını tahmin edebilirsin.
Bu modeli tüm training_data ile kuracak ve testing_data kullanarak değerlendireceksin.
Bu egzersiz
Tidyverse ile Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
- Tüm eğitim verilerini kullanarak en iyi performanslı modeli (mtry = 4) kurmak için
ranger()kullan. Bunubest_modeldeğişkenine ata. testing_dataiçindenlife_expectancysütununu çıkar vetest_actualdeğişkenine ata.best_modeliletestingverisindelife_expectancytahmini yap ve sonucutest_predicteddeğişkenine ata.- MAE'yi
test_actualvetest_predictedvektörlerini kullanarak hesapla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Build the model using all training data and the best performing parameter
best_model <- ranger(formula = ___, data = ___,
mtry = ___, num.trees = 100, seed = 42)
# Prepare the test_actual vector
test_actual <- testing_data$___
# Predict life_expectancy for the testing_data
test_predicted <- predict(___, ___)$predictions
# Calculate the test MAE
mae(___, ___)