Mulai sekarangMulai gratis

Bangun model klasifikasi final

Dengan membandingkan kinerja recall antara model regresi logistik (0,4) dan model random forest dengan kinerja terbaik (0,2), Anda mengetahui bahwa model dengan kinerja terbaik adalah model regresi logistik. Pada latihan ini, Anda akan membangun model regresi logistik menggunakan seluruh data train dan menyiapkan vektor yang diperlukan untuk mengevaluasi kinerja test dari model ini.

Latihan ini merupakan bagian dari kursus

Machine Learning di Tidyverse

Lihat Kursus

Instruksi latihan

  • Bangun model regresi logistik yang memprediksi Attrition menggunakan semua fitur yang tersedia di training_data.
  • Siapkan vektor biner nilai aktual uji, test_actual.
  • Siapkan vektor biner nilai prediksi dengan ambang probabilitas lebih besar dari 0,5 menunjukkan TRUE, dan simpan sebagai test_predicted.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Build the logistic regression model using all training data
best_model <- glm(formula = ___, 
                  data = ___, family = "binomial")


# Prepare binary vector of actual Attrition values for testing_data
test_actual <- testing_data$___ == "___"

# Prepare binary vector of predicted Attrition values for testing_data
test_predicted <- predict(___, ___, type = "response") > ___
Edit dan Jalankan Kode