Calculando a matriz de confusão
Uma matriz de confusão (às vezes chamada de tabela de confusão) é a base de todas as métricas de desempenho para modelos com resposta categórica (como uma regressão logística). Ela contém as contagens de cada par resposta real–resposta prevista. Neste caso, em que há duas respostas possíveis (churn ou não churn), existem quatro resultados possíveis.
- O cliente fez churn e o modelo previu isso.
- O cliente fez churn, mas o modelo não previu isso.
- O cliente não fez churn, mas o modelo previu que sim.
- O cliente não fez churn e o modelo previu isso.
churn e mdl_churn_vs_relationship estão disponíveis.
Este exercício faz parte do curso
Introdução à Regressão em R
Instruções do exercício
- Obtenha as respostas reais da coluna
has_churneddo conjunto de dados. Atribua aactual_response. - Obtenha as respostas previstas "mais prováveis" do modelo. Atribua a
predicted_response. - Crie uma tabela de contagens a partir dos vetores de resposta real e prevista. Atribua a
outcomes.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Get the actual responses from the dataset
actual_response <- ___
# Get the "most likely" responses from the model
predicted_response <- ___
# Create a table of counts
outcomes <- ___
# See the result
outcomes