1. Learn
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶ推測の基礎

Connected

Exercise

歪んだデータを置換検定で分析する

置換検定は、既存の仮説検定の前提条件を満たさない状況で役立ちます。この演習では、statsmodels パッケージを使って置換検定を実装します。

ここでは、analytics 分野の企業と、それ以外のベンチャー資金調達企業のあいだで、平均の資金調達ラウンド数を比較したいとします。t 検定を使いたくなるかもしれませんが、資金調達ラウンド数は正規分布では「ありません」。多くの企業はラウンドが 1 回のみで、2 回以上の企業数は急速に減少するためです。

次のデータが読み込まれています。

  • analytics_df - すべての analytics 企業のデータ
  • non_analytics_df - それ以外の非 analytics 企業のデータ

Instructions

100 XP
  • 2つのサンプル fundings_group_1 と fundings_group_2 を受け取り、funding_rounds の平均の差を返す統計量関数を定義します。
  • 各データセットの funding_rounds 列、定義した統計量関数、リサンプル数 100 を用いて置換検定を実行します。
  • 置換検定の結果の p 値を出力してください。