Cálculo da matriz de confusão
Uma matriz de confusão (ocasionalmente chamada de tabela de confusão) é a base de todas as métricas de desempenho para modelos com uma resposta categórica (como uma regressão logística). Ele contém as contagens de cada par de resposta real e resposta prevista. Nesse caso, em que há duas respostas possíveis (cancelar ou não cancelar), há quatro resultados gerais.
- O cliente cancelou a compra e o modelo previu isso.
- O cliente cancelou a compra, mas o modelo não previu isso.
- O cliente não cancelou a compra, mas o modelo previu que sim.
- O cliente não cancelou e o modelo previu isso.
churn
e mdl_churn_vs_relationship
estão disponíveis.
Este exercício faz parte do curso
Introdução à regressão em R
Instruções de exercício
- Obtenha as respostas reais da coluna
has_churned
do conjunto de dados. Atribuir aactual_response
. - Obtenha as respostas previstas "mais prováveis" do modelo. Atribuir a
predicted_response
. - Crie uma tabela de contagens a partir dos vetores de resposta reais e previstos. Atribuir a
outcomes
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Get the actual responses from the dataset
actual_response <- ___
# Get the "most likely" responses from the model
predicted_response <- ___
# Create a table of counts
outcomes <- ___
# See the result
outcomes