Razão de chances em log
Uma desvantagem de usar probabilidades e razões de chances nas previsões de regressão logística é que as linhas de previsão ficam curvas. Isso dificulta entender o que acontece com a previsão quando você altera a variável explicativa. O logaritmo da razão de chances (o "log da razão de chances") tem uma relação linear entre a resposta prevista e a variável explicativa. Isso significa que, conforme a variável explicativa muda, você não vê mudanças dramáticas na métrica de resposta — apenas mudanças lineares.
Como os valores do log da razão de chances são menos intuitivos do que a razão de chances (linear), para fins de visualização geralmente é melhor plotar a razão de chances e aplicar uma transformação log na escala do eixo y.
mdl_churn_vs_relationship, explanatory_data e plt_churn_vs_relationship estão disponíveis e dplyr está carregado.
Este exercício faz parte do curso
Introdução à Regressão em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Update the data frame
prediction_data <- explanatory_data %>%
mutate(
has_churned = predict(mdl_churn_vs_relationship, explanatory_data, type = "response"),
odds_ratio = has_churned / (1 - has_churned),
# Add the log odds ratio from odds_ratio
log_odds_ratio = ___,
# Add the log odds ratio using predict()
log_odds_ratio2 = ___
)
# See the result
prediction_data