Histogramdan KDE'ye
Bu egzersizlerde, "Heavy Duty Truck"lara kesilen cezaların verilerinden bir alt kümeye bakacağız. Veri meraklısı bir kamyon şoförü olabilir ve yola çıkmak için en tehlikeli zamanın ne olduğunu bilmek isteyebilirsin. Burada örneklem büyüklüğünün sadece 32 gözlem olduğunu unutma.
Aşağıda ggplot ile varsayılan bir histogram oluşturan kod var. Şaşırtıcı değil, pek iyi değil. 30 bölmeyi bile doldurmaya yetecek veri yok; bu da okumayı ve veriyi kavramayı zorlaştırıyor. Geometriyi geom_density() kullanarak bir KDE’ye çevir. Son olarak, görselleştirmeni olabildiğince şeffaf tutmak için, grafiğe KDE’nin kullandığı bant genişliğini izleyiciye söyleyen bir altyazı ekle.
Bu egzersiz, kursun bir parçasıdır
R'de Görselleştirme En İyi Uygulamaları
Egzersiz talimatları
- Histogram geometrisini yoğunluk geometrisine (
geom_density()) çevir. - Varsayılan bant genişliğini
1.5birim olacak şekilde ayarla. - Grafiğine çekirdeğinin bant genişliğini okura söylemek için
subtitleolarak"Gaussian kernel SD = 1.5"ekle.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# filter data to just heavy duty trucks
truck_speeding <- md_speeding %>%
filter(vehicle_type == "Heavy Duty Truck")
ggplot(truck_speeding, aes(x = hour_of_day)) +
# switch to density with bin width of 1.5, keep fill
geom_histogram(fill = 'steelblue') +
# add a subtitle stating binwidth
labs(title = 'Citations by hour')