1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ線形モデリング入門

Connected

演習

P値を可視化する

この演習では、推定した効果(「speed」)が、サンプル内の偶然のばらつきによって生じた可能性、つまり p 値を可視化します。具体的には、シャッフルして得た検定統計量の分布において、非シャッフルのサンプルから計算した検定統計量(「効果量」)の平均より右側に位置する点の割合として表現します。

最初の準備として、group_duration_short と group_duration_long、および compute_test_statistic()、shuffle_and_split()、plot_test_statistic_effect() をあらかじめ読み込んであります。

指示

100 XP
  • compute_test_statistic() を使って group_duration_short と group_duration_long から test_statistic_unshuffled を計算し、np.mean() で効果量を求めます。
  • shuffle_and_split() を使って shuffle_half1 と shuffle_half2 を作成し、compute_test_statistic() で test_statistic_shuffled を計算します。
  • ブールマスク condition を作成し、test_statistic_shuffled の値が effect_size 以上となるように指定します。次にこのマスクを使って p_value を計算します。
  • p_value を出力し、plot_test_statistic_effect() を使って両方の検定統計量をプロットします。