Güven Aralığı (CI) Oluşturma

Yeniden örnekleme yapıldığında p-şapka'nın nasıl değişebileceğine dair bir örnek gördün, ancak değişkenliğini iyi tahmin etmek için bunu çok daha fazla kez yapmamız gerekiyor. Burada, güven aralığı oluşturmakta kullanılacak standart hatayı (SE) tahmin etmek için tam bir bootstrap dağılımı hesaplayacaksın. infer paketinden ek bir fiil olan calculate() ile, birçok veri kümesinden birçok istatistik hesaplama sürecini hızlandıracaksın.

Bir an durup calculate çıktısını incele. Bu fonksiyon, veri çerçeveni yalnızca iki sütuna indirger: biri "stat"lar için, diğeri de karşılık geldikleri "replicate" için.

Bootstrap dağılımını çizdiğinde, çan şeklinde olduğunu göreceksin. İşte bu şekil, 95% aralık için iki SE ekleyip çıkarmana olanak tanır.

Bu egzersiz, kursun bir parçasıdır

R ile Kategorik Verilerde Çıkarım

Kursa Göz Atın

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Create bootstrap distribution for proportion with High conf
boot_dist <- gss2016 %>%
  # Specify the response and success
  specify(response = ___, ___ = "___") %>%
  # Generate 500 bootstrap reps
  generate(___ = ___, type = "bootstrap") %>%
  # Calculate proportions
  calculate(stat = "___")

# See the result
boot_dist

Kodu Düzenle ve Çalıştır