1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ統計シミュレーション

Connected

演習

検出力分析 - パート II

前回は、実験を1回だけシミュレーションして p 値を計算しました。ここではその枠組みを使って統計的検出力(power)を求めます。実験の検出力とは、差が本当に存在するときに、処置群と対照群の差を検出できる能力のことです。一般には、検出力80%を目指すのがよい実務的な目安です。

本演習のウェブサイトの例では、滞在時間が10%増加した差を、検出力80%で検出できるようにするには、各バリアントに何人の訪問が必要かを知りたいとします。このために、まずは小さなサンプル(50)から始め、同じ実験を複数回シミュレーションして検出力を確認します。80%に到達したら終了します。到達しない場合はサンプルサイズを増やして再度試します。

指示

100 XP
  • time_spent の乱数変数では、size をタプルにして、形状が sample_size × sims になるように設定します。
  • power は、p 値が 0.05 未満(統計的に有意)となる割合として計算します。
  • power が80%以上なら break して while ループを抜けます。満たさない場合は、sample_size を 10 ずつ増やし続けてください。