BaşlayınÜcretsiz Başlayın

Eğri (çarpık) veriyi permütasyon testiyle analiz etme

Permütasyon testleri, bildiğin hipotez testlerinin koşullarını sağlamayan durumlarda işe yarar olabilir. Bu egzersizde statsmodels paketini kullanarak bir permütasyon testi kodlayacaksın.

Analytics alanındaki şirketlerle diğer tüm girişim sermayesi destekli şirketler arasında ortalama yatırım turu sayısını karşılaştırmakla ilgileniyorsun. t-testi kullanmaya hevesli olabilirsin; ancak yatırım turu sayısının normal dağılıma uymadığından eminsin. Çoğu şirketin yalnızca bir turu var ve iki veya daha fazla tura sahip şirket sayısı hızla düşüyor.

Senin için aşağıdakiler yüklendi:

  • analytics_df - Tüm analytics şirketlerine ait veriler
  • non_analytics_df - Diğer tüm analytics dışı şirketlere ait veriler

Bu egzersiz

Python'da Çıkarımın Temelleri

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • fundings_group_1 ve fundings_group_2 adlı iki örneklem verildiğinde, funding_rounds ortalamaları farkını döndüren bir istatistik fonksiyonu tanımla.
  • Her veri setinin funding_rounds sütununu, tanımladığın istatistik fonksiyonunu ve 100 yeniden örneklemeyi kullanarak bir permütasyon testi gerçekleştir.
  • Permütasyon testinin ortaya çıkan p-değerini yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Write a "statistic" function which calculates the difference in means
def statistic(funding_group_1, funding_group_2):
  return ____(fundings_group_1) - ____(funding_group_2)

# Conduct a permutation test using 100 resamples
perm_result = stats.permutation_test((____['funding_rounds'], ____['funding_rounds']),
                                    statistic=____,
                                    n_resamples=____,
                                    vectorized=____)

# Print the p-value
____(____.pvalue)
Kodu Düzenle ve Çalıştır