Calcolare la matrice di confusione
Una matrice di confusione (a volte chiamata tabella di confusione) è alla base di tutte le metriche di performance per i modelli con una risposta categorica (come una regressione logistica). Contiene i conteggi di ciascuna coppia risposta effettiva–risposta prevista. In questo caso, in cui ci sono due possibili risposte (churn o non churn), ci sono quattro esiti complessivi.
- Il cliente ha fatto churn e il modello lo ha previsto.
- Il cliente ha fatto churn ma il modello non lo ha previsto.
- Il cliente non ha fatto churn ma il modello ha previsto di sì.
- Il cliente non ha fatto churn e il modello lo ha previsto.
churn e mdl_churn_vs_relationship sono disponibili.
Questo esercizio fa parte del corso
Introduzione alla regressione in R
Istruzioni dell'esercizio
- Ottieni le risposte effettive dalla colonna
has_churneddel dataset. Assegna aactual_response. - Ottieni le risposte previste "più probabili" dal modello. Assegna a
predicted_response. - Crea una tabella di conteggi a partire dai vettori di risposta effettiva e prevista. Assegna a
outcomes.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Get the actual responses from the dataset
actual_response <- ___
# Get the "most likely" responses from the model
predicted_response <- ___
# Create a table of counts
outcomes <- ___
# See the result
outcomes