P値を可視化する

この演習では、推定した効果（「speed」）が、サンプル内の偶然のばらつきによって生じた可能性、つまり p 値を可視化します。具体的には、シャッフルして得た検定統計量の分布において、非シャッフルのサンプルから計算した検定統計量（「効果量」）の平均より右側に位置する点の割合として表現します。

最初の準備として、group_duration_short と group_duration_long、および compute_test_statistic()、shuffle_and_split()、plot_test_statistic_effect() をあらかじめ読み込んであります。

compute_test_statistic() を使って group_duration_short と group_duration_long から test_statistic_unshuffled を計算し、np.mean() で効果量を求めます。
shuffle_and_split() を使って shuffle_half1 と shuffle_half2 を作成し、compute_test_statistic() で test_statistic_shuffled を計算します。
ブールマスク condition を作成し、test_statistic_shuffled の値が effect_size 以上となるように指定します。次にこのマスクを使って p_value を計算します。
p_value を出力し、plot_test_statistic_effect() を使って両方の検定統計量をプロットします。

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}演習

指示

演習