1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ線形モデリング入門

Connected

演習

検定統計量を可視化する

この演習では、帰無仮説に近づくために、2 通りの方法で得られた検定統計量の分布を比較します。

まず、早い時間帯と遅い時間帯でグループ化した 2 つの「母集団」を調べ、検定統計量の分布を計算します。次に、2 つの母集団をシャッフルして時間順をなくし、それぞれが早い・遅い時間の混在となるようにしてから、検定統計量の分布を再計算します。

準備として、2 つの時間継続グループ group_duration_short と group_duration_long、および 2 つの関数 shuffle_and_split() と plot_test_statistic() をあらかじめ読み込んであります。

指示

100 XP
  • np.random.choice() を使って group_duration_short と group_duration_long をリサンプリングし、リサンプルの差を取って test_statistic_unshuffled を計算します。
  • 元の group_duration_short と group_duration_long(この順序で指定)に対して shuffle_and_split() を用い、2 つの新しい混合集団を作成します。
  • シャッフル後の集団をリサンプリングし、resample_long から resample_short を引いて、新しい test_statistic_shuffled を計算します。
  • plot_test_statistic() を使って、2 つの検定統計量の分布をプロットし、見た目で比較します。