IniziaInizia gratis

Calcolare la matrice di confusione

Una matrice di confusione (a volte chiamata tabella di confusione) è alla base di tutte le metriche di performance per i modelli con una risposta categorica (come una regressione logistica). Contiene i conteggi di ciascuna coppia risposta effettiva–risposta prevista. In questo caso, in cui ci sono due possibili risposte (churn o non churn), ci sono quattro esiti complessivi.

  1. Il cliente ha fatto churn e il modello lo ha previsto.
  2. Il cliente ha fatto churn ma il modello non lo ha previsto.
  3. Il cliente non ha fatto churn ma il modello ha previsto di sì.
  4. Il cliente non ha fatto churn e il modello lo ha previsto.

churn e mdl_churn_vs_relationship sono disponibili.

Questo esercizio fa parte del corso

Introduzione alla regressione in R

Visualizza il corso

Istruzioni dell'esercizio

  • Ottieni le risposte effettive dalla colonna has_churned del dataset. Assegna a actual_response.
  • Ottieni le risposte previste "più probabili" dal modello. Assegna a predicted_response.
  • Crea una tabella di conteggi a partire dai vettori di risposta effettiva e prevista. Assegna a outcomes.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Get the actual responses from the dataset
actual_response <- ___

# Get the "most likely" responses from the model
predicted_response <- ___

# Create a table of counts
outcomes <- ___

# See the result
outcomes
Modifica ed esegui il codice