Güven Aralığı (CI) Oluşturma
Yeniden örnekleme yapıldığında p-şapka'nın nasıl değişebileceğine dair bir örnek gördün, ancak değişkenliğini iyi tahmin etmek için bunu çok daha fazla kez yapmamız gerekiyor. Burada, güven aralığı oluşturmakta kullanılacak standart hatayı (SE) tahmin etmek için tam bir bootstrap dağılımı hesaplayacaksın. infer paketinden ek bir fiil olan calculate() ile, birçok veri kümesinden birçok istatistik hesaplama sürecini hızlandıracaksın.
Bir an durup calculate çıktısını incele. Bu fonksiyon, veri çerçeveni yalnızca iki sütuna indirger: biri "stat"lar için, diğeri de karşılık geldikleri "replicate" için.
Bootstrap dağılımını çizdiğinde, çan şeklinde olduğunu göreceksin. İşte bu şekil, 95% aralık için iki SE ekleyip çıkarmana olanak tanır.
Bu egzersiz, kursun bir parçasıdır
R ile Kategorik Verilerde Çıkarım
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Create bootstrap distribution for proportion with High conf
boot_dist <- gss2016 %>%
# Specify the response and success
specify(response = ___, ___ = "___") %>%
# Generate 500 bootstrap reps
generate(___ = ___, type = "bootstrap") %>%
# Calculate proportions
calculate(stat = "___")
# See the result
boot_dist