Güven Aralığı (CI) Oluşturma
Yeniden örnekleme yapıldığında p-şapka'nın nasıl değişebileceğine dair bir örnek gördün, ancak değişkenliğini iyi tahmin etmek için bunu çok daha fazla kez yapmamız gerekiyor. Burada, güven aralığı oluşturmakta kullanılacak standart hatayı (SE) tahmin etmek için tam bir bootstrap dağılımı hesaplayacaksın. infer paketinden ek bir fiil olan calculate() ile, birçok veri kümesinden birçok istatistik hesaplama sürecini hızlandıracaksın.
Bir an durup calculate çıktısını incele. Bu fonksiyon, veri çerçeveni yalnızca iki sütuna indirger: biri "stat"lar için, diğeri de karşılık geldikleri "replicate" için.
Bootstrap dağılımını çizdiğinde, çan şeklinde olduğunu göreceksin. İşte bu şekil, 95% aralık için iki SE ekleyip çıkarmana olanak tanır.
Bu egzersiz
R ile Kategorik Verilerde Çıkarım
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create bootstrap distribution for proportion with High conf
boot_dist <- gss2016 %>%
# Specify the response and success
specify(response = ___, ___ = "___") %>%
# Generate 500 bootstrap reps
generate(___ = ___, type = "bootstrap") %>%
# Calculate proportions
calculate(stat = "___")
# See the result
boot_dist