Largeur de bin selon le contexte
Le code fourni examine la distribution des contraventions par heure de la journée. Remarquez que les barres ne tombent pas précisément sur chaque heure, ce qui rend l’interprétation des hauteurs un peu maladroite. Lorsque vos données présentent des points de coupure naturels comme ici, profitez-en. Dans ce cas, nous pouvons définir nos coupures exactement sur les limites d’heure.
Modifiez geom_histogram() pour fixer binwidth à 1 heure. Cet argument, toutefois, ne dit pas à ggplot où commencer ses bacs, ce qui par défaut est déterminé par l’étendue des données. Pour corriger cela, définissez l’argument center à 0.5. Cela indique que vous souhaitez qu’une des barres soit centrée à 30 minutes après minuit ; ggplot aligne ensuite les autres barres en conséquence. (Vous pourriez le fixer à n’importe quelle heure + 0.5, comme 2.5, 3.5, etc.)
Cet exercice fait partie du cours
Bonnes pratiques de visualisation avec R
Instructions
- Définissez
binwidthdu graphique à 1. - Centrez les barres sur la demi-heure avec l’argument
center.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
ggplot(md_speeding,aes(x = hour_of_day)) +
geom_histogram(
___ # set binwidth to 1
___ # Center bins at the half (0.5) hour
) +
scale_x_continuous(breaks = 0:24)