Grupları karşılaştırma
Bu egzersizde, verilerin dağılımlarını gruplar arasında karşılaştıracaksın.
Datasets paketindeki PlantGrowth veri kümesi, verim üzerine yapılan bir deneyin sonuçlarını içerir.
Veri kümesinde iki değişken vardır:
group- verilen sonucun kontrol grubundan mı yoksa iki tedavi grubundan birinden mi geldiğini belirtir,weight- verimi ölçmek için kullanılan bitkilerin kurutulmuş ağırlığı.
tapply() fonksiyonunun, metrikleri gruplar arasında hesaplamak için kullanılabildiğini hatırla.
Örneğin,
tapply(df$x, df$grp, FUN = median)
df veri çerçevesindeki grp grupları boyunca x'in ortancasını döndürür.
Görevin, verim ağırlıklarının ortalamalarını hesaplamak ve beş yaygın istatistiği görselleştirmek. Grafik gösterim, tepki değişkenindeki farkları gruplar arasında karşılaştırmana yardımcı olacak.
Bu egzersiz, kursun bir parçasıdır
R ile İstatistik Mülakat Soruları Pratiği
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Calculate means across groups
tapply(___, PlantGrowth$group, FUN = ___)
# Graphically compare statistics across groups
___(___ ~ group, data = ___)