Crea il modello di classificazione finale
Confrontando la recall tra il modello di regressione logistica (0.4) e il miglior modello random forest (0.2), hai visto che il modello con le prestazioni migliori è la regressione logistica. In questo esercizio costruirai il modello di regressione logistica usando tutti i dati di train e preparerai i vettori necessari per valutare le prestazioni sul test di questo modello.
Questo esercizio fa parte del corso
Machine Learning nel tidyverse
Istruzioni dell'esercizio
- Crea un modello di regressione logistica che predica
Attritionusando tutte le variabili disponibili intraining_data. - Prepara il vettore binario dei valori reali di test,
test_actual. - Prepara il vettore binario dei valori previsti in cui una probabilità maggiore di 0.5 indica
TRUEe salvalo cometest_predicted.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Build the logistic regression model using all training data
best_model <- glm(formula = ___,
data = ___, family = "binomial")
# Prepare binary vector of actual Attrition values for testing_data
test_actual <- testing_data$___ == "___"
# Prepare binary vector of predicted Attrition values for testing_data
test_predicted <- predict(___, ___, type = "response") > ___