KDE dengan banyak data
Kode yang disediakan akan membuat KDE dasar dari percentage_over_limit untuk semua sitasi. Sekilas, pengaturannya masuk akal. Kita memiliki banyak data sehingga lebar bin dibuat sempit: hanya satu persen. Selain itu, rug plot yang telah ditambahkan dengan pertimbangan, memiliki nilai alpha yang diturunkan menjadi 0.7.
Saat menjalankan kode ini, Anda akan segera melihat bahwa plotnya kurang baik. Estimasi densitas tampak seperti landak dan rug plot pada dasarnya menjadi batang hitam tebal karena tumpang tindih yang masif.
Perbaiki dengan menaikkan lebar bin sedikit menjadi 2.5 dan menurunkan alpha pada rug plot menjadi 0.05 agar dapat menangkap tingkat tumpang tindih titik. Jangan lupa ubah subtitle untuk mencerminkan perubahan lebar kernel!
Latihan ini adalah bagian dari kursus
Praktik Terbaik Visualisasi di R
Petunjuk latihan
- Ubah simpangan baku kernel menjadi
2.5 - Atur
alphadari rug plot menjadi0.05 - Ubah
subtitlemenjadi"Gaussian kernel SD = 2.5"untuk mencerminkan lebar kernel yang baru.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
ggplot(md_speeding, aes(x = percentage_over_limit)) +
# Increase bin width to 2.5
geom_density(fill = 'steelblue', bw = 1, alpha = 0.7) +
# lower rugplot alpha to 0.05
geom_rug(alpha = 0.5) +
labs(
title = 'Distribution of % over speed limit',
# modify subtitle to reflect change in kernel width
subtitle = "Gaussian kernel SD = 1"
)