Hitung ukuran sebaran
Mari kita perluas sintaks group_by() dan summarize() yang kuat ke ukuran sebaran. Jika Anda belum yakin apakah Anda bekerja dengan distribusi yang simetris atau menyimpang (skewed), sebaiknya pertimbangkan ukuran yang andal seperti IQR selain ukuran umum seperti varians atau simpangan baku.
Latihan ini adalah bagian dari kursus
Analisis Data Eksploratori dengan R
Petunjuk latihan
Himpunan data gap2007 yang Anda buat pada latihan sebelumnya tersedia di area kerja Anda.
- Untuk setiap benua dalam
gap2007, rangkum harapan hidup menggunakansd(),IQR(), dan jumlah negara,n(). Tidak perlu memberi nama kolom baru yang dihasilkan di sini. Fungsin()di dalam pemanggilansummarize()tidak memerlukan argumen apa pun. - Bandingkan secara grafis sebaran distribusi ini dengan membuat plot kerapatan yang ditumpuk (overlaid) untuk harapan hidup yang dipecah menurut benua.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Compute groupwise measures of spread
gap2007 %>%
group_by(___) %>%
summarize(___,
___,
___)
# Generate overlaid density plots
gap2007 %>%
ggplot(aes(x = ___, fill = ___)) +
geom_density(alpha = 0.3)