Menganalisis data miring dengan uji permutasi
Uji permutasi berguna untuk situasi yang tidak memenuhi syarat uji hipotesis yang sudah Anda ketahui. Pada latihan ini Anda akan menulis kode uji permutasi menggunakan paket statsmodels.
Anda tertarik membandingkan rata-rata jumlah putaran pendanaan antara perusahaan di bidang analytics dan semua perusahaan lain yang didanai modal ventura. Meskipun Anda mungkin tergoda menggunakan uji t, Anda dapat yakin bahwa jumlah putaran pendanaan tidak berdistribusi normal. Sebaliknya, mayoritas perusahaan hanya memiliki satu putaran, dan jumlah perusahaan dengan dua putaran atau lebih cepat menurun.
Berikut telah dimuat untuk Anda:
analytics_df- Data semua perusahaan analyticsnon_analytics_df- Data semua perusahaan non-analytics lainnya
Latihan ini merupakan bagian dari kursus
Dasar-dasar Inferensi di Python
Instruksi latihan
- Definisikan fungsi statistik yang, diberikan dua sampel
fundings_group_1danfundings_group_2, mengembalikan selisih rata-rata jumlahfunding_rounds. - Lakukan uji permutasi menggunakan kolom
funding_roundsdari setiap himpunan data, fungsi statistik yang Anda definisikan, dan 100 pengambilan ulang (resample). - Cetak p-value yang dihasilkan dari uji permutasi Anda.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Write a "statistic" function which calculates the difference in means
def statistic(funding_group_1, funding_group_2):
return ____(fundings_group_1) - ____(funding_group_2)
# Conduct a permutation test using 100 resamples
perm_result = stats.permutation_test((____['funding_rounds'], ____['funding_rounds']),
statistic=____,
n_resamples=____,
vectorized=____)
# Print the p-value
____(____.pvalue)