Grupları karşılaştırma
Bu egzersizde, verilerin dağılımlarını gruplar arasında karşılaştıracaksın.
Datasets paketindeki PlantGrowth veri kümesi, verim üzerine yapılan bir deneyin sonuçlarını içerir.
Veri kümesinde iki değişken vardır:
group- verilen sonucun kontrol grubundan mı yoksa iki tedavi grubundan birinden mi geldiğini belirtir,weight- verimi ölçmek için kullanılan bitkilerin kurutulmuş ağırlığı.
tapply() fonksiyonunun, metrikleri gruplar arasında hesaplamak için kullanılabildiğini hatırla.
Örneğin,
tapply(df$x, df$grp, FUN = median)
df veri çerçevesindeki grp grupları boyunca x'in ortancasını döndürür.
Görevin, verim ağırlıklarının ortalamalarını hesaplamak ve beş yaygın istatistiği görselleştirmek. Grafik gösterim, tepki değişkenindeki farkları gruplar arasında karşılaştırmana yardımcı olacak.
Bu egzersiz
R ile İstatistik Mülakat Soruları Pratiği
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Calculate means across groups
tapply(___, PlantGrowth$group, FUN = ___)
# Graphically compare statistics across groups
___(___ ~ group, data = ___)