ComenzarEmpieza gratis

De histograma a KDE

En estos ejercicios, vamos a analizar un subconjunto de nuestros datos con multas impuestas a "Heavy Duty Truck". Puede que seamos un/a camionero/a con conocimientos de datos y queramos saber cuál es el momento más peligroso para estar en la carretera. Ten en cuenta que el tamaño de la muestra aquí es de solo 32 observaciones.

Abajo tienes el código para crear un histograma predeterminado con ggplot. Como era de esperar, no es ideal. No hay suficientes datos para completar ni siquiera 30 intervalos, lo que dificulta la lectura y la interpretación. Cambia la geometría a una KDE usando geom_density(). Por último, para ser lo más transparente posible con tu visualización, añade un subtítulo al gráfico indicando al lector la anchura de banda que has usado en tu KDE.

Este ejercicio forma parte del curso

Buenas prácticas de visualización en R

Ver curso

Instrucciones del ejercicio

  • Cambia la geometría de histograma a una de densidad (geom_density()).
  • Modifica la anchura de banda predeterminada a 1.5 unidades.
  • Añade el subtitle "Gaussian kernel SD = 1.5" a tu gráfico, indicando al lector la anchura de banda de tu kernel.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# filter data to just heavy duty trucks
truck_speeding <- md_speeding %>% 
    filter(vehicle_type == "Heavy Duty Truck")
 
ggplot(truck_speeding, aes(x = hour_of_day)) +
    # switch to density with bin width of 1.5, keep fill 
    geom_histogram(fill = 'steelblue') +
    # add a subtitle stating binwidth
    labs(title = 'Citations by hour')
Editar y ejecutar código