Aan de slagGa gratis aan de slag

Likelihood & log-likelihood

Lineaire regressie probeert een "som van kwadraten"-maatstaf te optimaliseren om de best passende lijn te vinden. Die maatstaf is niet van toepassing op logistische regressie. In plaats daarvan probeert logistische regressie een maatstaf te optimaliseren die likelihood heet, of een gerelateerde maatstaf, log-likelihood.

Het dashboard toont churnstatus versus tijd sinds de laatste aankoop uit de churn-gegevensset. De blauwe stippellijn is de logistische regressielijn die is berekend met geom_smooth() van ggplot2. (Dat is de "best passende" lijn.) De zwarte doorgetrokken lijn laat een voorspellingslijn zien die is berekend uit de intercept- en hellingscoëfficiënten die je opgeeft als plogis(intercept + slope * time_since_last_purchase).

Verander de intercept- en hellingscoëfficiënten en kijk hoe de waarden van likelihood en log-likelihood veranderen.

Als je dichter bij de best passende lijn komt, welke uitspraak is dan waar over likelihood en log-likelihood?

Deze oefening maakt deel uit van de cursus

Intermediary Regression in R

Cursus bekijken

Praktische interactieve oefening

Zet theorie om in actie met een van onze interactieve oefeningen.

Begin met trainen