KDE con muchos datos
El código proporcionado genera un KDE básico de percentage_over_limit para todas las multas. A primera vista, la configuración parece razonable. Tenemos muchos datos, así que ponemos un ancho de banda estrecho: solo un 1%. Además, el rug plot, que se ha añadido con buen criterio, tiene una alpha reducida de 0.7.
Al ejecutar el código verás enseguida que no es un buen gráfico. La estimación de densidad parece un puercoespín y el rug plot es básicamente una barra negra gruesa por el enorme solapamiento.
Arréglalo aumentando un poco el ancho de banda a 2.5 y bajando la alpha del rug plot a 0.05 para intentar percibir el solapamiento de puntos. No olvides cambiar el subtítulo para reflejar el cambio en el ancho del kernel.
Este ejercicio forma parte del curso
Buenas prácticas de visualización en R
Instrucciones del ejercicio
- Cambia la desviación estándar del kernel a
2.5. - Establece la
alphadel rug plot en0.05. - Cambia el
subtitlea"Gaussian kernel SD = 2.5"para reflejar el nuevo ancho del kernel.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
ggplot(md_speeding, aes(x = percentage_over_limit)) +
# Increase bin width to 2.5
geom_density(fill = 'steelblue', bw = 1, alpha = 0.7) +
# lower rugplot alpha to 0.05
geom_rug(alpha = 0.5) +
labs(
title = 'Distribution of % over speed limit',
# modify subtitle to reflect change in kernel width
subtitle = "Gaussian kernel SD = 1"
)