BaşlayınÜcretsiz Başlayın

Histogramdan KDE'ye

Bu egzersizlerde, "Heavy Duty Truck"lara kesilen cezaların verilerinden bir alt kümeye bakacağız. Veri meraklısı bir kamyon şoförü olabilir ve yola çıkmak için en tehlikeli zamanın ne olduğunu bilmek isteyebilirsin. Burada örneklem büyüklüğünün sadece 32 gözlem olduğunu unutma.

Aşağıda ggplot ile varsayılan bir histogram oluşturan kod var. Şaşırtıcı değil, pek iyi değil. 30 bölmeyi bile doldurmaya yetecek veri yok; bu da okumayı ve veriyi kavramayı zorlaştırıyor. Geometriyi geom_density() kullanarak bir KDE’ye çevir. Son olarak, görselleştirmeni olabildiğince şeffaf tutmak için, grafiğe KDE’nin kullandığı bant genişliğini izleyiciye söyleyen bir altyazı ekle.

Bu egzersiz

R'de Görselleştirme En İyi Uygulamaları

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Histogram geometrisini yoğunluk geometrisine (geom_density()) çevir.
  • Varsayılan bant genişliğini 1.5 birim olacak şekilde ayarla.
  • Grafiğine çekirdeğinin bant genişliğini okura söylemek için subtitle olarak "Gaussian kernel SD = 1.5" ekle.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# filter data to just heavy duty trucks
truck_speeding <- md_speeding %>% 
    filter(vehicle_type == "Heavy Duty Truck")
 
ggplot(truck_speeding, aes(x = hour_of_day)) +
    # switch to density with bin width of 1.5, keep fill 
    geom_histogram(fill = 'steelblue') +
    # add a subtitle stating binwidth
    labs(title = 'Citations by hour')
Kodu Düzenle ve Çalıştır