CommencerCommencer gratuitement

Comparer les sorties d’une régression logistique

Lorsque vous construisez des modèles, il est préférable d’avoir plus d’observations que de paramètres estimés. Ces variables supplémentaires sont appelées degrés de liberté.

Un modèle avec trop peu d’observations peut être sujet au surapprentissage ou même impossible à ajuster (parfois appelé singulier). En outre, examiner les degrés de liberté peut vous aider à vérifier vos données et votre code. Par exemple, un écart entre les degrés de liberté et le nombre d’observations que vous pensez avoir peut indiquer que vos données nécessitent un nettoyage supplémentaire, qu’il y a un bogue dans votre code, ou qu’il existe une erreur de modélisation.

Les formats d’entrée « wide » et « long » pour glm() produisent des degrés de liberté différents, car la différence de nombre de lignes dans les données amène le modèle à interpréter un nombre d’observations différent.

Dans les exercices précédents, vous avez ajusté une régression logistique en utilisant trois options d’entrée différentes. Celles-ci ont été chargées pour vous sous les noms lr_1, lr_2 et lr_3. Examinez les résumés de ces trois modèles.

Comment les degrés de liberté varient-ils selon les modèles ?

Cet exercice fait partie du cours

Modèles Linéaires Généralisés (GLM) en R

Afficher le cours

Exercice interactif pratique

Passez de la théorie à la pratique avec l’un de nos exercices interactifs

Commencer l’exercice