Güç Analizi - Bölüm II
Daha önce, deneyin tek bir örneğini simüle edip bir p-değeri üretmiştik. Şimdi bu çerçeveyi istatistiksel gücü hesaplamak için kullanacağız. Bir deneyin gücü, eğer gerçekten bir fark varsa, deneyin tedavi ve kontrol arasındaki farkı tespit edebilme yeteneğidir. İyi bir istatistiksel uygulama olarak %80 güce ulaşmayı hedeflemek gerekir.
Web sitemiz için, her varyantı kaç kişinin ziyaret etmesi gerektiğini ve böylece harcanan süredeki %10’luk bir artışı %80 güçle tespit edebileceğimizi bulmak istediğimizi varsayalım. Bunun için küçük bir örneklemle (50) başlarız, bu deneyi birden çok kez simüle eder ve gücü kontrol ederiz. %80 güce ulaşılırsa dururuz. Ulaşılmazsa örneklem büyüklüğünü artırır ve tekrar deneriz.
Bu egzersiz
Python'da İstatistiksel Benzetim
kursunun bir parçasıdırEgzersiz talimatları
time_spentrassal değişkenleri için, şekilsample_size\(\times\)simsolacak şekildesizedeğerini demet (tuple) olarak ayarla.powerdeğerini, 0.05’ten küçük (istatistiksel olarak anlamlı) p-değerlerinin oranı olarak hesapla.- Eğer
power%80’den büyük veya eşitse, while döngüsündenbreakile çık. Değilse,sample_sizedeğerini 10’ar 10’ar artırmaya devam et.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
sample_size = 50
# Keep incrementing sample size by 10 till we reach required power
while 1:
control_time_spent = np.random.normal(loc=control_mean, scale=control_sd, size=(____,____)))
treatment_time_spent = np.random.normal(loc=control_mean*(1+effect_size), scale=control_sd, size=(____,____))
t, p = st.ttest_ind(treatment_time_spent, control_time_spent)
# Power is the fraction of times in the simulation when the p-value was less than 0.05
power = (p < 0.05).sum()/____
if ____:
____
else:
____ += ____
print("For 80% power, sample size required = {}".format(sample_size))