ComeçarComece de graça

Calculando a matriz de confusão

Uma matriz de confusão (às vezes chamada de tabela de confusão) é a base de todas as métricas de desempenho para modelos com resposta categórica (como uma regressão logística). Ela contém as contagens de cada par resposta real–resposta prevista. Neste caso, em que há duas respostas possíveis (churn ou não churn), existem quatro resultados possíveis.

  1. O cliente fez churn e o modelo previu isso.
  2. O cliente fez churn, mas o modelo não previu isso.
  3. O cliente não fez churn, mas o modelo previu que sim.
  4. O cliente não fez churn e o modelo previu isso.

churn e mdl_churn_vs_relationship estão disponíveis.

Este exercício faz parte do curso

Introdução à Regressão em R

Ver curso

Instruções do exercício

  • Obtenha as respostas reais da coluna has_churned do conjunto de dados. Atribua a actual_response.
  • Obtenha as respostas previstas "mais prováveis" do modelo. Atribua a predicted_response.
  • Crie uma tabela de contagens a partir dos vetores de resposta real e prevista. Atribua a outcomes.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Get the actual responses from the dataset
actual_response <- ___

# Get the "most likely" responses from the model
predicted_response <- ___

# Create a table of counts
outcomes <- ___

# See the result
outcomes
Editar e executar o código