1. Lära sig
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶ統計思考(パート2)

Connected

exercise

ウェブサイト滞在時間のアナロジー

実は、すでに広告キャンペーンの前後でウェブサイトの滞在時間がどれだけ変わるかを調べる A/B テストに相当する仮説検定を行っています。連続量であるカエルの舌の力(ウェブサイト滞在時間と同じタイプの量)がそのアナロジーです。「前」= Frog A、「後」= Frog B と考えられます。ここでは、実際の前後比較のシナリオであらためて練習しましょう。

ノーヒッターのデータセットに戻ります。1920 年、メジャーリーグベースボールでは、いわゆるデッドボール時代を終わらせる重要なルール変更が実施されました。特に投手は、ボールに唾をつけたり傷をつけたりすることが禁じられ、これは投手に大きく有利に働いていた行為でした。この問題では、これらのルール変更によってノーヒッターの発生率が遅くなった(つまり、ノーヒッター間の平均時間が長くなった)かどうかを、平均ノーヒッター間隔の差を検定統計量として用いて A/B テストで調べます。各時代のノーヒッター間隔は配列 nht_dead と nht_live に格納されています。ここで「nht」は「no-hitter time(ノーヒッター間隔)」を表します。

この演習では draw_perm_reps() 関数を使うので、その呼び出しシグネチャを思い出しておくと便利です:draw_perm_reps(d1, d2, func, size=1)。必要なら、これを定義した第 3 章の演習に戻って確認してもかまいません。

Instruktioner

100 XP
  • diff_of_means() を使って、観測された平均ノーヒッター間隔の差を計算します。
  • draw_perm_reps() を使って、平均の差の置換レプリケートを 10,000 個生成します。
  • p 値を計算して出力します。