CommencerCommencer gratuitement

Visualiser les données de criminalité du Maryland

Avant d’ajuster un modèle, tracer les données permet de voir si des tendances ou des points particuliers ressortent, s’il existe des valeurs aberrantes ou si d’autres caractéristiques des données méritent une analyse ultérieure. Avec ggplot2, vous pouvez tracer des lignes par comté et examiner comment les crimes évoluent dans le temps. Pour cet exercice, étudiez les données de criminalité du Maryland (md_crime). Elles incluent l’Year, le nombre de crimes violents (Crime) dans le comté, et le nom du County.

Pour explorer ces données, commencez par tracer les points pour chaque comté au fil du temps. Cela vous permet de voir comment chaque comté évolue. Plutôt que d’utiliser un attribut esthétique comme color, on utilise ici group car il y a trop de comtés pour distinguer facilement les couleurs. Après avoir tracé les données brutes, ajoutez des lignes de tendance pour chaque comté.

Les points reliés (geom_line) et les lignes de tendance (geom_smooth) donnent toutes deux un aperçu des types d’effets aléatoires éventuellement nécessaires. Si tous les points semblent avoir des étendues et des moyennes similaires, un intercept à effet aléatoire peut ne pas être important. De même, si les tendances paraissent cohérentes entre les comtés (c’est‑à‑dire si les lignes de tendance se ressemblent ou sont parallèles entre groupes), une pente à effet aléatoire peut ne pas être requise.

Cet exercice fait partie du cours

Modèles hiérarchiques et à effets mixtes en R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Plot the change in crime through time by County
plot1 <- 
	ggplot(data = md_crime, 
           aes(x = ___, y = ___, group = ___)) +
    geom_line() + 
    theme_minimal() +
    ylab("Major crimes reported per county")
print(plot1)

# Add the trend line for each county
plot1 + ___
Modifier et exécuter le code