ComeçarComece gratuitamente

Cálculo da matriz de confusão

Uma matriz de confusão (ocasionalmente chamada de tabela de confusão) é a base de todas as métricas de desempenho para modelos com uma resposta categórica (como uma regressão logística). Ele contém as contagens de cada par de resposta real e resposta prevista. Nesse caso, em que há duas respostas possíveis (cancelar ou não cancelar), há quatro resultados gerais.

  1. O cliente cancelou a compra e o modelo previu isso.
  2. O cliente cancelou a compra, mas o modelo não previu isso.
  3. O cliente não cancelou a compra, mas o modelo previu que sim.
  4. O cliente não cancelou e o modelo previu isso.

churn e mdl_churn_vs_relationship estão disponíveis.

Este exercício faz parte do curso

Introdução à regressão em R

Ver Curso

Instruções de exercício

  • Obtenha as respostas reais da coluna has_churned do conjunto de dados. Atribuir a actual_response.
  • Obtenha as respostas previstas "mais prováveis" do modelo. Atribuir a predicted_response.
  • Crie uma tabela de contagens a partir dos vetores de resposta reais e previstos. Atribuir a outcomes.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Get the actual responses from the dataset
actual_response <- ___

# Get the "most likely" responses from the model
predicted_response <- ___

# Create a table of counts
outcomes <- ___

# See the result
outcomes
Editar e executar código