MulaiMulai sekarang secara gratis

Histogram ke KDE

Untuk latihan ini, kita akan melihat subset data berupa surat tilang yang diberikan kepada "Heavy Duty Truck". Bayangkan Anda seorang sopir truk yang paham data dan ingin mengetahui kapan waktu paling berbahaya untuk berada di jalan. Perhatikan bahwa ukuran sampel di sini hanya 32 observasi.

Di bawah ini ada kode untuk membuat histogram bawaan dengan ggplot. Tidak mengejutkan, hasilnya kurang baik. Datanya tidak cukup untuk mengisi bahkan 30 bin, sehingga sulit dibaca atau dipahami. Ubah geometri plot menjadi KDE dengan menggunakan geom_density(). Terakhir, demi menjaga transparansi visualisasi Anda, tambahkan subjudul pada plot yang memberi tahu pemirsa lebar bin yang digunakan untuk KDE Anda.

Latihan ini adalah bagian dari kursus

Praktik Terbaik Visualisasi di R

Lihat Kursus

Petunjuk latihan

  • Ubah geometri histogram menjadi kepadatan (geom_density()).
  • Ubah lebar bin bawaan menjadi 1.5 satuan.
  • Tambahkan subtitle "Gaussian kernel SD = 1.5" pada plot Anda untuk memberi tahu pembaca lebar bin kernel Anda.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# filter data to just heavy duty trucks
truck_speeding <- md_speeding %>% 
    filter(vehicle_type == "Heavy Duty Truck")
 
ggplot(truck_speeding, aes(x = hour_of_day)) +
    # switch to density with bin width of 1.5, keep fill 
    geom_histogram(fill = 'steelblue') +
    # add a subtitle stating binwidth
    labs(title = 'Citations by hour')
Edit dan Jalankan Kode