Bir veya daha fazla değişken için belirli istatistikler
Daha önce gördüğün gibi, bir veri kümesinde bir veya daha fazla değişken için tek seferde birçok betimsel istatistik elde etmek üzere summary(), psych::describe() ya da Hmisc::describe() gibi fonksiyonları kullanabilirsin. Ayrıca önceki egzersizlerde mean(), median(), sd() ve diğerleri gibi fonksiyonlarla tekil istatistikler de hesapladın.
Buna ek olarak, dplyr paketi, tek başına summarise() fonksiyonunu ya da bir veya daha fazla değişken için aynı anda ilgilendiğin birden çok özel istatiği birlikte hesaplamak üzere across(everything(), list()) sözdizimini sunar.
abaloneKeep veri kümesi ve dplyr paketi senin için zaten yüklendi.
Bu egzersiz
SAS Kullananlar İçin R
kursunun bir parçasıdırEgzersiz talimatları
abaloneKeepveri kümesindensummary()kullanarak shucked weight ve whole weight için özet istatistikleri al.dplyrpaketindekisummarise()fonksiyonunu kullanarak length değişkeninin ortalamasını ve standart sapmasını hesapla. Çıktı istatistiklerinin adını sırasıyla ortalama ve standart sapma içinmean_lengthvesd_lengtholarak ver.dplyrpaketindekisummarise(across(everything(), list()))sözdizimini kullanarak height ve diameter için ortalama ve standart sapmayı al.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Run summary() for shuckedWeight and wholeWeight
abaloneKeep %>%
select(___, ___) %>%
___
# Get mean and sd for length
abaloneKeep %>%
___(___ = mean(___),
___ = sd(___))
# Get mean and sd for height and diameter
abaloneKeep %>%
___ %>%
summarise(across(everything(),list(___ = ~ mean(.x),
___ = ~ sd(.x))))