MulaiMulai sekarang secara gratis

Bangun model klasifikasi final

Dengan membandingkan kinerja recall antara model regresi logistik (0,4) dan model random forest dengan kinerja terbaik (0,2), Anda mengetahui bahwa model dengan kinerja terbaik adalah model regresi logistik. Pada latihan ini, Anda akan membangun model regresi logistik menggunakan seluruh data train dan menyiapkan vektor yang diperlukan untuk mengevaluasi kinerja test dari model ini.

Latihan ini adalah bagian dari kursus

Machine Learning di Tidyverse

Lihat Kursus

Petunjuk latihan

  • Bangun model regresi logistik yang memprediksi Attrition menggunakan semua fitur yang tersedia di training_data.
  • Siapkan vektor biner nilai aktual uji, test_actual.
  • Siapkan vektor biner nilai prediksi dengan ambang probabilitas lebih besar dari 0,5 menunjukkan TRUE, dan simpan sebagai test_predicted.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Build the logistic regression model using all training data
best_model <- glm(formula = ___, 
                  data = ___, family = "binomial")


# Prepare binary vector of actual Attrition values for testing_data
test_actual <- testing_data$___ == "___"

# Prepare binary vector of predicted Attrition values for testing_data
test_predicted <- predict(___, ___, type = "response") > ___
Edit dan Jalankan Kode