Statistik spesifik untuk satu atau lebih variabel
Seperti yang Anda lihat sebelumnya, Anda dapat menggunakan fungsi seperti summary(), psych::describe() atau Hmisc::describe() untuk memperoleh banyak statistik deskriptif sekaligus bagi satu atau lebih variabel dalam sebuah himpunan data. Anda juga telah menghitung statistik individual pada latihan sebelumnya menggunakan fungsi seperti mean(), median(), sd() dan lainnya.
Namun, paket dplyr menyediakan fungsi summarise() sendiri atau dengan menambahkan sintaks across(everything(), list()) untuk menghitung beberapa statistik kustom yang Anda butuhkan secara bersamaan bagi satu atau lebih variabel sekaligus.
Himpunan data abaloneKeep dan paket dplyr sudah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
R untuk Pengguna SAS
Petunjuk latihan
- Dapatkan statistik ringkasan untuk shucked weight dan whole weight dari himpunan data
abaloneKeepmenggunakansummary(). - Dapatkan rataan dan simpangan baku dari length menggunakan fungsi
summarise()dari paketdplyr. Beri nama keluaran statistikmean_lengthdansd_lengthmasing-masing untuk rataan dan simpangan baku. - Dapatkan rataan dan simpangan baku dari height dan diameter menggunakan sintaks
summarise(across(everything(), list()))dari paketdplyr.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Run summary() for shuckedWeight and wholeWeight
abaloneKeep %>%
select(___, ___) %>%
___
# Get mean and sd for length
abaloneKeep %>%
___(___ = mean(___),
___ = sd(___))
# Get mean and sd for height and diameter
abaloneKeep %>%
___ %>%
summarise(across(everything(),list(___ = ~ mean(.x),
___ = ~ sd(.x))))