ComenzarEmpieza gratis

KDE con muchos datos

El código proporcionado genera un KDE básico de percentage_over_limit para todas las multas. A primera vista, la configuración parece razonable. Tenemos muchos datos, así que ponemos un ancho de banda estrecho: solo un 1%. Además, el rug plot, que se ha añadido con buen criterio, tiene una alpha reducida de 0.7.

Al ejecutar el código verás enseguida que no es un buen gráfico. La estimación de densidad parece un puercoespín y el rug plot es básicamente una barra negra gruesa por el enorme solapamiento.

Arréglalo aumentando un poco el ancho de banda a 2.5 y bajando la alpha del rug plot a 0.05 para intentar percibir el solapamiento de puntos. No olvides cambiar el subtítulo para reflejar el cambio en el ancho del kernel.

Este ejercicio forma parte del curso

Buenas prácticas de visualización en R

Ver curso

Instrucciones del ejercicio

  • Cambia la desviación estándar del kernel a 2.5.
  • Establece la alpha del rug plot en 0.05.
  • Cambia el subtitle a "Gaussian kernel SD = 2.5" para reflejar el nuevo ancho del kernel.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

ggplot(md_speeding, aes(x = percentage_over_limit)) +
    # Increase bin width to 2.5
    geom_density(fill = 'steelblue', bw = 1,  alpha = 0.7) + 
    # lower rugplot alpha to 0.05
    geom_rug(alpha = 0.5) + 
    labs(
        title = 'Distribution of % over speed limit', 
        # modify subtitle to reflect change in kernel width
        subtitle = "Gaussian kernel SD = 1"
    )
Editar y ejecutar código