Likelihood e log-likelihood
A regressão linear tenta otimizar uma métrica de "soma dos quadrados" para encontrar o melhor ajuste. Essa métrica não se aplica à regressão logística. Em vez disso, a regressão logística tenta otimizar uma métrica chamada likelihood (verossimilhança) ou uma métrica relacionada chamada log-likelihood (log-verossimilhança).
O painel mostra o status de churn em função do tempo desde a última compra no conjunto de dados churn. A linha azul pontilhada é a linha de previsão da regressão logística calculada pelo geom_smooth() do ggplot2. (Ou seja, é a linha de "melhor ajuste".) A linha preta contínua mostra uma linha de previsão calculada a partir dos coeficientes de intercepto e inclinação que você especifica como plogis(intercept + slope * time_since_last_purchase).
Altere os coeficientes de intercepto e inclinação e observe como os valores de likelihood e log-likelihood mudam.
À medida que você se aproxima da linha de melhor ajuste, qual afirmação é verdadeira sobre likelihood e log-likelihood?
Este exercício faz parte do curso
Regressão intermediária no R
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
Começar o exercício