CommencerCommencer gratuitement

Vraisemblance et log-vraisemblance

La régression linéaire cherche à optimiser une métrique de « somme des carrés » pour trouver le meilleur ajustement. Cette métrique ne s’applique pas à la régression logistique. À la place, la régression logistique cherche à optimiser une métrique appelée « vraisemblance », ou une métrique associée appelée « log-vraisemblance ».

Le tableau de bord affiche le statut de churn en fonction du temps écoulé depuis le dernier achat, à partir du jeu de données churn. La ligne bleue pointillée est la courbe de prédiction de la régression logistique calculée par geom_smooth() de ggplot2 (autrement dit, c’est la « meilleure » courbe d’ajustement). La ligne noire continue montre une ligne de prédiction calculée à partir de l’ordonnée à l’origine et du coefficient de pente que vous spécifiez sous la forme plogis(intercept + slope * time_since_last_purchase).

Modifiez l’ordonnée à l’origine et la pente, puis observez comment les valeurs de vraisemblance et de log-vraisemblance évoluent.

À mesure que vous vous rapprochez de la courbe de meilleur ajustement, quelle affirmation est vraie concernant la vraisemblance et la log-vraisemblance ?

Cet exercice fait partie du cours

Régression intermédiaire en R

Afficher le cours

Exercice interactif pratique

Passez de la théorie à la pratique avec l’un de nos exercices interactifs

Commencer l’exercice