1. 学ぶ
  2. /
  3. コース
  4. /
  5. 統計的思考 ケーススタディ

Connected

演習

仮説検定:これは偶然起こり得るか?

EDA(探索的データ分析)と線形回帰分析の結果は、かなり明確な結論を示しています。ここではさらに一歩進めて、ジグザグ効果の分析を締めくくりましょう。コースの内外のレーンにおける偶数・奇数レーン間の平均相対差に、レーン割り当てが影響していないという仮説を、順列検定によって検証します。検定統計量には dcst.pearson_r() で計算できるピアソン相関係数を使用します。変数 lanes と f_13 はすでに名前空間に読み込まれています。

指示

100 XP
  • ピアソン相関係数の観測値を計算し、rho として保存しましょう。
  • np.empty() を使って、rho の順列レプリケートを10,000個格納する配列を初期化し、perm_reps_rho という名前を付けましょう。
  • 順列レプリケートを生成する for ループを記述しましょう。
    • np.random.permutation() を使って lanes 配列をシャッフルしましょう。
    • シャッフルした lanes 配列と f_13 の間のピアソン相関係数を計算し、結果を perm_reps_rho に保存しましょう。
  • p値を計算して出力しましょう。「少なくとも同程度に極端」とは、ピアソン相関係数が観測値以上であることを意味します。