Membangun & mengevaluasi model terbaik
Dengan cross-validation Anda berhasil mengidentifikasi model terbaik untuk memprediksi life_expectancy menggunakan semua fitur dalam gapminder. Sekarang setelah Anda memilih model, Anda dapat menggunakan himpunan data independen (testing_data) yang telah disisihkan untuk memperkirakan kinerja model ini pada data baru.
Anda akan membangun model ini menggunakan seluruh training_data dan mengevaluasinya menggunakan testing_data.
Latihan ini adalah bagian dari kursus
Machine Learning di Tidyverse
Petunjuk latihan
- Gunakan
ranger()untuk membangun model dengan performa terbaik (mtry = 4) menggunakan seluruh data pelatihan. Simpan sebagaibest_model. - Ekstrak kolom
life_expectancydaritesting_datadan simpan sebagaitest_actual. - Prediksi
life_expectancymenggunakanbest_modelpada datatestingdan simpan sebagaitest_predicted. - Hitung MAE menggunakan vektor
test_actualdantest_predicted.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Build the model using all training data and the best performing parameter
best_model <- ranger(formula = ___, data = ___,
mtry = ___, num.trees = 100, seed = 42)
# Prepare the test_actual vector
test_actual <- testing_data$___
# Predict life_expectancy for the testing_data
test_predicted <- predict(___, ___)$predictions
# Calculate the test MAE
mae(___, ___)