De histograma a KDE
En estos ejercicios, vamos a analizar un subconjunto de nuestros datos con multas impuestas a "Heavy Duty Truck". Puede que seamos un/a camionero/a con conocimientos de datos y queramos saber cuál es el momento más peligroso para estar en la carretera. Ten en cuenta que el tamaño de la muestra aquí es de solo 32 observaciones.
Abajo tienes el código para crear un histograma predeterminado con ggplot. Como era de esperar, no es ideal. No hay suficientes datos para completar ni siquiera 30 intervalos, lo que dificulta la lectura y la interpretación. Cambia la geometría a una KDE usando geom_density(). Por último, para ser lo más transparente posible con tu visualización, añade un subtítulo al gráfico indicando al lector la anchura de banda que has usado en tu KDE.
Este ejercicio forma parte del curso
Buenas prácticas de visualización en R
Instrucciones del ejercicio
- Cambia la geometría de histograma a una de densidad (
geom_density()). - Modifica la anchura de banda predeterminada a
1.5unidades. - Añade el
subtitle"Gaussian kernel SD = 1.5"a tu gráfico, indicando al lector la anchura de banda de tu kernel.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# filter data to just heavy duty trucks
truck_speeding <- md_speeding %>%
filter(vehicle_type == "Heavy Duty Truck")
ggplot(truck_speeding, aes(x = hour_of_day)) +
# switch to density with bin width of 1.5, keep fill
geom_histogram(fill = 'steelblue') +
# add a subtitle stating binwidth
labs(title = 'Citations by hour')