Méthodes pour les lignes de tendance
Dans l’exercice précédent, vous avez utilisé le geom_smooth() par défaut de ggplot2.
Dans cet exercice, vous allez plutôt utiliser un glm().
Cela vous permettra de « voir » une régression logistique avec ggplot2.
Concrètement, vous allez tracer la probabilité qu’une personne prenne le bus en fonction de la distance de son trajet domicile-travail.
Vous devrez indiquer à geom_smooth() d’utiliser la méthode glm().
Rappelez-vous du chapitre 2 que la famille par défaut d’un glm() est la famille gaussienne, qui produit les mêmes résultats qu’un lm().
Vous devrez donc aussi préciser l’argument de méthode de glm().
Le code pour créer gg_jitter, que vous avez construit dans le dernier exercice, vous est fourni.
Cet exercice fait partie du cours
Modèles Linéaires Généralisés (GLM) en R
Instructions
- Utilisez la méthode
"glm"avecgeom_smooth(). - Avec
method.args, définissez la famille sur'binomial'.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a jittered plot of MilesOneWay vs Bus2 using the bus dataset
gg_jitter <- ggplot(data = bus, aes(x = MilesOneWay, y = Bus2)) +
geom_jitter(width = 0, height = 0.05) +
ylab("Probability of riding the bus") +
xlab("One-way commute trip (in miles)")
# Add a geom_smooth() that uses a GLM method to your plot
gg_jitter + geom_smooth(method = ___ , method.args = list(___))