CommencerCommencer gratuitement

Largeur de bin selon le contexte

Le code fourni examine la distribution des contraventions par heure de la journée. Remarquez que les barres ne tombent pas précisément sur chaque heure, ce qui rend l’interprétation des hauteurs un peu maladroite. Lorsque vos données présentent des points de coupure naturels comme ici, profitez-en. Dans ce cas, nous pouvons définir nos coupures exactement sur les limites d’heure.

Modifiez geom_histogram() pour fixer binwidth à 1 heure. Cet argument, toutefois, ne dit pas à ggplot où commencer ses bacs, ce qui par défaut est déterminé par l’étendue des données. Pour corriger cela, définissez l’argument center à 0.5. Cela indique que vous souhaitez qu’une des barres soit centrée à 30 minutes après minuit ; ggplot aligne ensuite les autres barres en conséquence. (Vous pourriez le fixer à n’importe quelle heure + 0.5, comme 2.5, 3.5, etc.)

Cet exercice fait partie du cours

Bonnes pratiques de visualisation avec R

Afficher le cours

Instructions

  • Définissez binwidth du graphique à 1.
  • Centrez les barres sur la demi-heure avec l’argument center.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

ggplot(md_speeding,aes(x = hour_of_day)) +
    geom_histogram(
        ___  # set binwidth to 1
        ___  # Center bins at the half (0.5) hour
    ) +
    scale_x_continuous(breaks = 0:24)
Modifier et exécuter le code