Ancho de bin según el contexto
El código proporcionado analiza la distribución de multas por hora del día. Fíjate en que las barras no caen exactamente en cada hora, lo que dificulta un poco interpretar su altura. Cuando tus datos tienen puntos de corte naturales como este, conviene aprovecharlos. En este caso, podemos hacer que los cortes coincidan con los límites de las horas.
Modifica geom_histogram() para establecer binwidth en 1 hora. Sin embargo, este argumento no le indica a ggplot dónde empezar los bins, que por defecto se determina por la extensión de los datos. Para solucionarlo, establece el argumento center en 0.5. Esto indica que quieres una de las barras centrada a los 30 minutos pasada la medianoche; ggplot ordenará el resto de las barras en consecuencia. (Podrías fijarlo en cualquier hora + 0.5, como 2.5, 3.5, etc.).
Este ejercicio forma parte del curso
Buenas prácticas de visualización en R
Instrucciones del ejercicio
- Establece el
binwidthdel gráfico en 1. - Centra las barras en la media hora con el argumento
center.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
ggplot(md_speeding,aes(x = hour_of_day)) +
geom_histogram(
___ # set binwidth to 1
___ # Center bins at the half (0.5) hour
) +
scale_x_continuous(breaks = 0:24)