Eğri (çarpık) veriyi permütasyon testiyle analiz etme
Permütasyon testleri, bildiğin hipotez testlerinin koşullarını sağlamayan durumlarda işe yarar olabilir. Bu egzersizde statsmodels paketini kullanarak bir permütasyon testi kodlayacaksın.
Analytics alanındaki şirketlerle diğer tüm girişim sermayesi destekli şirketler arasında ortalama yatırım turu sayısını karşılaştırmakla ilgileniyorsun. t-testi kullanmaya hevesli olabilirsin; ancak yatırım turu sayısının normal dağılıma uymadığından eminsin. Çoğu şirketin yalnızca bir turu var ve iki veya daha fazla tura sahip şirket sayısı hızla düşüyor.
Senin için aşağıdakiler yüklendi:
analytics_df- Tüm analytics şirketlerine ait verilernon_analytics_df- Diğer tüm analytics dışı şirketlere ait veriler
Bu egzersiz
Python'da Çıkarımın Temelleri
kursunun bir parçasıdırEgzersiz talimatları
fundings_group_1vefundings_group_2adlı iki örneklem verildiğinde,funding_roundsortalamaları farkını döndüren bir istatistik fonksiyonu tanımla.- Her veri setinin
funding_roundssütununu, tanımladığın istatistik fonksiyonunu ve 100 yeniden örneklemeyi kullanarak bir permütasyon testi gerçekleştir. - Permütasyon testinin ortaya çıkan p-değerini yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Write a "statistic" function which calculates the difference in means
def statistic(funding_group_1, funding_group_2):
return ____(fundings_group_1) - ____(funding_group_2)
# Conduct a permutation test using 100 resamples
perm_result = stats.permutation_test((____['funding_rounds'], ____['funding_rounds']),
statistic=____,
n_resamples=____,
vectorized=____)
# Print the p-value
____(____.pvalue)