Probabilidade e log-verossimilhança
A regressão linear tenta otimizar uma métrica de "soma de quadrados" para encontrar o melhor ajuste. Essa métrica não se aplica à regressão logística. Em vez disso, a regressão logística tenta otimizar uma métrica chamada probabilidade, ou uma métrica relacionada chamada log-verossimilhança.
O painel mostra o status da rotatividade em relação ao tempo desde a última compra do conjunto de dados churn
. A linha pontilhada azul é a linha de previsão de regressão logística calculada pelo geom_smooth()
do ggplot2. (Ou seja, é a linha de "melhor ajuste"). A linha sólida preta mostra uma linha de previsão calculada a partir dos coeficientes de interceptação e inclinação que você especificar como plogis(intercept + slope * time_since_last_purchase)
.
Altere os coeficientes de interceptação e inclinação e observe como os valores de probabilidade e log-verossimilhança mudam.
À medida que você se aproxima da linha de melhor ajuste, qual afirmação é verdadeira sobre a probabilidade e a log-verossimilhança?
Este exercício faz parte do curso
Regressão intermediária no R
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
