Adattamento in-sample modello ristretto
Hai calcolato l’accuratezza per logitModelFull. È fondamentale farlo per tutti i modelli candidati.
Per questo, logitModelNew è già specificato e presente nel tuo environment.
Quando confronti i valori dei diversi modelli: se più modelli hanno la stessa accuratezza, scegli sempre il modello con meno variabili esplicative.
Questo esercizio fa parte del corso
Machine Learning per il Marketing Analytics in R
Istruzioni dell'esercizio
Ripeti gli stessi passaggi dell’esercizio precedente per il nuovo modello.
Usa
predict()per ottenere la probabilità che ciascun cliente non onori il pagamento.Poi calcola una matrice di confusione con la stessa soglia di 0.5 per la classificazione. Nota che
SDMToolsnon è più scaricabile da CRAN. Installalo invece tramiteremotes::install_version("SDMTools", "1.1-221.2").Calcola l’accuratezza del modello ristretto e confrontala con l’accuratezza del modello completo. Proseguirai l’analisi solo con il modello migliore.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Calculate the accuracy for 'logitModelNew'
# Make prediction
defaultData$predNew <- predict(logitModelNew, type = ___, na.action = ___)
# Construct the in-sample confusion matrix
confMatrixModelNew <- confusion.matrix(defaultData$___,defaultData$___, threshold = ___)
confMatrixModelNew
# Calculate the accuracy...
accuracyNew <- sum(diag(___)) / ___(___)
accuracyNew
# and compare it to the full model's accuracy
accuracyFull