CommencerCommencer gratuitement

Méthodes pour les lignes de tendance

Dans l’exercice précédent, vous avez utilisé le geom_smooth() par défaut de ggplot2. Dans cet exercice, vous allez plutôt utiliser un glm(). Cela vous permettra de « voir » une régression logistique avec ggplot2. Concrètement, vous allez tracer la probabilité qu’une personne prenne le bus en fonction de la distance de son trajet domicile-travail.

Vous devrez indiquer à geom_smooth() d’utiliser la méthode glm(). Rappelez-vous du chapitre 2 que la famille par défaut d’un glm() est la famille gaussienne, qui produit les mêmes résultats qu’un lm(). Vous devrez donc aussi préciser l’argument de méthode de glm().
Le code pour créer gg_jitter, que vous avez construit dans le dernier exercice, vous est fourni.

Cet exercice fait partie du cours

Modèles Linéaires Généralisés (GLM) en R

Afficher le cours

Instructions

  • Utilisez la méthode "glm" avec geom_smooth().
  • Avec method.args, définissez la famille sur 'binomial'.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a jittered plot of MilesOneWay vs Bus2 using the bus dataset
gg_jitter <- ggplot(data = bus, aes(x = MilesOneWay, y = Bus2)) + 
	geom_jitter(width = 0, height = 0.05) +
	ylab("Probability of riding the bus") +
	xlab("One-way commute trip (in miles)")

# Add a geom_smooth() that uses a GLM method to your plot
gg_jitter + geom_smooth(method =  ___ , method.args = list(___))
Modifier et exécuter le code