Memvisualisasikan data kejahatan Maryland
Sebelum menyesuaikan model, membuat plot data dapat membantu untuk melihat apakah ada tren atau titik data yang menonjol, keberadaan pencilan, atau atribut lain dari data yang perlu dipertimbangkan ke depan.
Dengan ggplot2, Anda dapat memplot garis per county dan menelaah bagaimana kejahatan berubah seiring waktu.
Untuk latihan ini, telaah data kejahatan Maryland (md_crime). Data ini mencakup Year, jumlah Crime kekerasan di county, serta nama County.
Untuk mengeksplorasi data ini, terlebih dahulu plot titik data untuk setiap county sepanjang waktu. Ini memungkinkan Anda melihat bagaimana masing-masing county berubah dari waktu ke waktu. Alih-alih menggunakan estetika seperti color, di sini digunakan group karena terlalu banyak county untuk dibedakan warnanya dengan mudah. Setelah memplot data mentah, tambahkan garis tren untuk setiap county.
Baik titik yang dihubungkan (geom_line) maupun garis tren (geom_smooth) memberikan wawasan tentang apakah diperlukan random effect dan jenisnya. Jika semua titik tampak memiliki rentang dan rataan yang serupa, intersep random effect mungkin tidak penting. Demikian pula, jika tren tampak konsisten di seluruh county (mis., garis tren terlihat mirip atau paralel antarkelompok), kemiringan random effect mungkin tidak diperlukan.
Latihan ini adalah bagian dari kursus
Model Hierarki dan Mixed Effects di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Plot the change in crime through time by County
plot1 <-
ggplot(data = md_crime,
aes(x = ___, y = ___, group = ___)) +
geom_line() +
theme_minimal() +
ylab("Major crimes reported per county")
print(plot1)
# Add the trend line for each county
plot1 + ___