BaşlayınÜcretsiz Başlayın

Maryland suç verilerini görselleştirme

Bir modeli kurmadan önce verileri çizmek; göze çarpan eğilimleri ya da veri noktalarını görmek, aykırı değerleri fark etmek veya gelecekte değerlendirilmesi gereken diğer özellikleri belirlemek için faydalı olabilir. ggplot2 kullanarak ilçeler (county) için çizgiler çizebilir ve suçların zaman içinde nasıl değiştiğini inceleyebilirsin. Bu egzersizde Maryland suç verilerini (md_crime) inceleyeceksin. Bu veri kümesi Year (Yıl), ilçedeki şiddet içeren Crime (Suç) sayısı ve County'nin adını içerir.

Bu veriyi keşfetmek için önce her ilçe için zaman içinde veri noktalarını çiz. Bu sayede her ilçenin zaman içindeki değişimini görebilirsin. Burada color gibi bir estetik yerine group kullanılıyor; çünkü ilçe sayısı fazla ve renkleri ayırt etmek zor. Ham veriyi çizdikten sonra her ilçe için eğilim çizgileri ekle.

Noktaları birleştiren çizgiler (geom_line) ve eğilim çizgileri (geom_smooth) hangi tür rastgele etkilerin gerekli olduğuna dair içgörü sağlar. Eğer tüm noktalar benzer aralıklara ve ortalamalara sahipse, rastgele etkili bir kesişim terimi önemli olmayabilir. Benzer şekilde, ilçeler arasında eğilimler tutarlı görünüyorsa (yani grup çizgileri benzer ya da birbirine paralelse), rastgele etkili bir eğim terimi gerekli olmayabilir.

Bu egzersiz

R'da Hiyerarşik ve Karma Etkili Modeller

kursunun bir parçasıdır
Kursu Görüntüle

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Plot the change in crime through time by County
plot1 <- 
	ggplot(data = md_crime, 
           aes(x = ___, y = ___, group = ___)) +
    geom_line() + 
    theme_minimal() +
    ylab("Major crimes reported per county")
print(plot1)

# Add the trend line for each county
plot1 + ___
Kodu Düzenle ve Çalıştır