Histogram ke KDE
Untuk latihan ini, kita akan melihat subset data berupa surat tilang yang diberikan kepada "Heavy Duty Truck". Bayangkan Anda seorang sopir truk yang paham data dan ingin mengetahui kapan waktu paling berbahaya untuk berada di jalan. Perhatikan bahwa ukuran sampel di sini hanya 32 observasi.
Di bawah ini ada kode untuk membuat histogram bawaan dengan ggplot. Tidak mengejutkan, hasilnya kurang baik. Datanya tidak cukup untuk mengisi bahkan 30 bin, sehingga sulit dibaca atau dipahami. Ubah geometri plot menjadi KDE dengan menggunakan geom_density(). Terakhir, demi menjaga transparansi visualisasi Anda, tambahkan subjudul pada plot yang memberi tahu pemirsa lebar bin yang digunakan untuk KDE Anda.
Latihan ini adalah bagian dari kursus
Praktik Terbaik Visualisasi di R
Petunjuk latihan
- Ubah geometri histogram menjadi kepadatan (
geom_density()). - Ubah lebar bin bawaan menjadi
1.5satuan. - Tambahkan
subtitle"Gaussian kernel SD = 1.5"pada plot Anda untuk memberi tahu pembaca lebar bin kernel Anda.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# filter data to just heavy duty trucks
truck_speeding <- md_speeding %>%
filter(vehicle_type == "Heavy Duty Truck")
ggplot(truck_speeding, aes(x = hour_of_day)) +
# switch to density with bin width of 1.5, keep fill
geom_histogram(fill = 'steelblue') +
# add a subtitle stating binwidth
labs(title = 'Citations by hour')