Bangun model klasifikasi final
Dengan membandingkan kinerja recall antara model regresi logistik (0,4) dan model random forest dengan kinerja terbaik (0,2), Anda mengetahui bahwa model dengan kinerja terbaik adalah model regresi logistik. Pada latihan ini, Anda akan membangun model regresi logistik menggunakan seluruh data train dan menyiapkan vektor yang diperlukan untuk mengevaluasi kinerja test dari model ini.
Latihan ini adalah bagian dari kursus
Machine Learning di Tidyverse
Petunjuk latihan
- Bangun model regresi logistik yang memprediksi
Attritionmenggunakan semua fitur yang tersedia ditraining_data. - Siapkan vektor biner nilai aktual uji,
test_actual. - Siapkan vektor biner nilai prediksi dengan ambang probabilitas lebih besar dari 0,5 menunjukkan
TRUE, dan simpan sebagaitest_predicted.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Build the logistic regression model using all training data
best_model <- glm(formula = ___,
data = ___, family = "binomial")
# Prepare binary vector of actual Attrition values for testing_data
test_actual <- testing_data$___ == "___"
# Prepare binary vector of predicted Attrition values for testing_data
test_predicted <- predict(___, ___, type = "response") > ___