Histogramdan KDE'ye
Bu egzersizlerde, "Heavy Duty Truck"lara kesilen cezaların verilerinden bir alt kümeye bakacağız. Veri meraklısı bir kamyon şoförü olabilir ve yola çıkmak için en tehlikeli zamanın ne olduğunu bilmek isteyebilirsin. Burada örneklem büyüklüğünün sadece 32 gözlem olduğunu unutma.
Aşağıda ggplot ile varsayılan bir histogram oluşturan kod var. Şaşırtıcı değil, pek iyi değil. 30 bölmeyi bile doldurmaya yetecek veri yok; bu da okumayı ve veriyi kavramayı zorlaştırıyor. Geometriyi geom_density() kullanarak bir KDE’ye çevir. Son olarak, görselleştirmeni olabildiğince şeffaf tutmak için, grafiğe KDE’nin kullandığı bant genişliğini izleyiciye söyleyen bir altyazı ekle.
Bu egzersiz
R'de Görselleştirme En İyi Uygulamaları
kursunun bir parçasıdırEgzersiz talimatları
- Histogram geometrisini yoğunluk geometrisine (
geom_density()) çevir. - Varsayılan bant genişliğini
1.5birim olacak şekilde ayarla. - Grafiğine çekirdeğinin bant genişliğini okura söylemek için
subtitleolarak"Gaussian kernel SD = 1.5"ekle.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# filter data to just heavy duty trucks
truck_speeding <- md_speeding %>%
filter(vehicle_type == "Heavy Duty Truck")
ggplot(truck_speeding, aes(x = hour_of_day)) +
# switch to density with bin width of 1.5, keep fill
geom_histogram(fill = 'steelblue') +
# add a subtitle stating binwidth
labs(title = 'Citations by hour')