IniziaInizia gratis

Visualizzare i dati sui crimini del Maryland

Prima di adattare un modello, tracciare i dati può aiutarti a "vedere" se emergono tendenze o punti anomali, se esistono outlier o se altri aspetti dei dati richiedono attenzione in futuro. Usando ggplot2, puoi tracciare linee per contea ed esaminare come i crimini cambiano nel tempo. Per questo esercizio, esamina i dati sui crimini del Maryland (md_crime). Includono l'Year, il conteggio dei Crime violenti nella contea e il nome della County.

Per esplorare questi dati, inizia tracciando i punti per ogni contea nel tempo. Questo ti permette di vedere come cambia ciascuna contea nel tempo. Invece di usare un'estetica come color, qui si usa group perché ci sono troppe contee per distinguere facilmente i colori. Dopo aver tracciato i dati grezzi, aggiungi le linee di tendenza per ogni contea.

Sia i punti collegati (geom_line) sia le linee di tendenza (geom_smooth) danno indicazioni su quali, se presenti, tipi di effetti casuali possono servire. Se tutti i punti sembrano avere intervalli e medie simili, un intercetta a effetto casuale potrebbe non essere importante. Allo stesso modo, se le tendenze sembrano coerenti tra le contee (ovvero le linee di tendenza appaiono simili o parallele tra i gruppi), una pendenza a effetto casuale potrebbe non essere necessaria.

Questo esercizio fa parte del corso

Modelli gerarchici e a effetti misti in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Plot the change in crime through time by County
plot1 <- 
	ggplot(data = md_crime, 
           aes(x = ___, y = ___, group = ___)) +
    geom_line() + 
    theme_minimal() +
    ylab("Major crimes reported per county")
print(plot1)

# Add the trend line for each county
plot1 + ___
Modifica ed esegui il codice