ComenzarEmpieza gratis

Visualizar los datos de delincuencia de Maryland

Antes de ajustar un modelo, representar los datos puede ayudarte a ver si destacan tendencias o puntos, si hay valores atípicos, o si existen otros aspectos que convenga tener en cuenta más adelante. Con ggplot2, puedes trazar líneas por condado y examinar cómo cambian los delitos a lo largo del tiempo. En este ejercicio, examina los datos de delincuencia de Maryland (md_crime). Incluyen el Year, el recuento de delitos violentos Crime en el condado y el nombre del County.

Para explorar estos datos, primero representa los puntos para cada condado a lo largo del tiempo. Esto te permite ver cómo cambia cada condado con el tiempo. En lugar de usar un estético como color, aquí se usa group porque hay demasiados condados para distinguir los colores con facilidad. Después de trazar los datos sin procesar, añade líneas de tendencia para cada condado.

Tanto los puntos conectados (geom_line) como las líneas de tendencia (geom_smooth) ofrecen información sobre qué tipos de efectos aleatorios podrían ser necesarios. Si todos los puntos parecen tener rangos y medias similares, puede que un intercepto de efecto aleatorio no sea importante. Del mismo modo, si las tendencias parecen consistentes entre condados (es decir, si las líneas de tendencia son similares o paralelas entre grupos), puede que no se necesite una pendiente de efecto aleatorio.

Este ejercicio forma parte del curso

Modelos jerárquicos y de efectos mixtos en R

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Plot the change in crime through time by County
plot1 <- 
	ggplot(data = md_crime, 
           aes(x = ___, y = ___, group = ___)) +
    geom_line() + 
    theme_minimal() +
    ylab("Major crimes reported per county")
print(plot1)

# Add the trend line for each county
plot1 + ___
Editar y ejecutar código