Mulai sekarangMulai gratis

Menganalisis data miring dengan uji permutasi

Uji permutasi berguna untuk situasi yang tidak memenuhi syarat uji hipotesis yang sudah Anda ketahui. Pada latihan ini Anda akan menulis kode uji permutasi menggunakan paket statsmodels.

Anda tertarik membandingkan rata-rata jumlah putaran pendanaan antara perusahaan di bidang analytics dan semua perusahaan lain yang didanai modal ventura. Meskipun Anda mungkin tergoda menggunakan uji t, Anda dapat yakin bahwa jumlah putaran pendanaan tidak berdistribusi normal. Sebaliknya, mayoritas perusahaan hanya memiliki satu putaran, dan jumlah perusahaan dengan dua putaran atau lebih cepat menurun.

Berikut telah dimuat untuk Anda:

  • analytics_df - Data semua perusahaan analytics
  • non_analytics_df - Data semua perusahaan non-analytics lainnya

Latihan ini merupakan bagian dari kursus

Dasar-dasar Inferensi di Python

Lihat Kursus

Instruksi latihan

  • Definisikan fungsi statistik yang, diberikan dua sampel fundings_group_1 dan fundings_group_2, mengembalikan selisih rata-rata jumlah funding_rounds.
  • Lakukan uji permutasi menggunakan kolom funding_rounds dari setiap himpunan data, fungsi statistik yang Anda definisikan, dan 100 pengambilan ulang (resample).
  • Cetak p-value yang dihasilkan dari uji permutasi Anda.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Write a "statistic" function which calculates the difference in means
def statistic(funding_group_1, funding_group_2):
  return ____(fundings_group_1) - ____(funding_group_2)

# Conduct a permutation test using 100 resamples
perm_result = stats.permutation_test((____['funding_rounds'], ____['funding_rounds']),
                                    statistic=____,
                                    n_resamples=____,
                                    vectorized=____)

# Print the p-value
____(____.pvalue)
Edit dan Jalankan Kode