MulaiMulai sekarang secara gratis

Membangun & mengevaluasi model terbaik

Dengan cross-validation Anda berhasil mengidentifikasi model terbaik untuk memprediksi life_expectancy menggunakan semua fitur dalam gapminder. Sekarang setelah Anda memilih model, Anda dapat menggunakan himpunan data independen (testing_data) yang telah disisihkan untuk memperkirakan kinerja model ini pada data baru.

Anda akan membangun model ini menggunakan seluruh training_data dan mengevaluasinya menggunakan testing_data.

Latihan ini adalah bagian dari kursus

Machine Learning di Tidyverse

Lihat Kursus

Petunjuk latihan

  • Gunakan ranger() untuk membangun model dengan performa terbaik (mtry = 4) menggunakan seluruh data pelatihan. Simpan sebagai best_model.
  • Ekstrak kolom life_expectancy dari testing_data dan simpan sebagai test_actual.
  • Prediksi life_expectancy menggunakan best_model pada data testing dan simpan sebagai test_predicted.
  • Hitung MAE menggunakan vektor test_actual dan test_predicted.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Build the model using all training data and the best performing parameter
best_model <- ranger(formula = ___, data = ___,
                     mtry = ___, num.trees = 100, seed = 42)

# Prepare the test_actual vector
test_actual <- testing_data$___

# Predict life_expectancy for the testing_data
test_predicted <- predict(___, ___)$predictions

# Calculate the test MAE
mae(___, ___)
Edit dan Jalankan Kode