Menganalisis data miring dengan uji permutasi
Uji permutasi berguna untuk situasi yang tidak memenuhi syarat uji hipotesis yang sudah Anda ketahui. Pada latihan ini Anda akan menulis kode uji permutasi menggunakan paket statsmodels.
Anda tertarik membandingkan rata-rata jumlah putaran pendanaan antara perusahaan di bidang analytics dan semua perusahaan lain yang didanai modal ventura. Meskipun Anda mungkin tergoda menggunakan uji t, Anda dapat yakin bahwa jumlah putaran pendanaan tidak berdistribusi normal. Sebaliknya, mayoritas perusahaan hanya memiliki satu putaran, dan jumlah perusahaan dengan dua putaran atau lebih cepat menurun.
Berikut telah dimuat untuk Anda:
analytics_df- Data semua perusahaan analyticsnon_analytics_df- Data semua perusahaan non-analytics lainnya
Latihan ini adalah bagian dari kursus
Dasar-dasar Inferensi di Python
Petunjuk latihan
- Definisikan fungsi statistik yang, diberikan dua sampel
fundings_group_1danfundings_group_2, mengembalikan selisih rata-rata jumlahfunding_rounds. - Lakukan uji permutasi menggunakan kolom
funding_roundsdari setiap himpunan data, fungsi statistik yang Anda definisikan, dan 100 pengambilan ulang (resample). - Cetak p-value yang dihasilkan dari uji permutasi Anda.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Write a "statistic" function which calculates the difference in means
def statistic(funding_group_1, funding_group_2):
return ____(fundings_group_1) - ____(funding_group_2)
# Conduct a permutation test using 100 resamples
perm_result = stats.permutation_test((____['funding_rounds'], ____['funding_rounds']),
statistic=____,
n_resamples=____,
vectorized=____)
# Print the p-value
____(____.pvalue)