1. 学ぶ
  2. /
  3. コース
  4. /
  5. 統計的思考 ケーススタディ

Connected

演習

置換検定の実施方法

EDA とパラメータ推定の結果から、準決勝から決勝にかけての改善を明確に判断するのは難しい状況です。次の演習では、準決勝と決勝の間にパフォーマンスの差がないという帰無仮説を検定します。この目的には置換検定が適しています。検定統計量として f の平均値を使用します。次のうち、帰無仮説のもとで検定統計量をシミュレートする正しい方法はどれですか?

  • 方法 1
  • 各選手・種目別に、準決勝タイムの配列と決勝タイムの配列を用意します。
  • 各配列を順に処理し、インデックスごとに 50% の確率で準決勝と決勝の値を入れ替えます。
  • 結果として得られた準決勝・決勝の配列から f を計算し、次にその平均を求めます。
  • 方法 2
  • 各選手・種目別に、準決勝タイムの配列と決勝タイムの配列を結合し、合計 96 件のデータを作成します。
  • np.permutation() 関数を使って結合した配列をシャッフルします。シャッフル後の最初の 48 件を「準決勝」、残りの 48 件を「決勝」として割り当てます。
  • この新しい準決勝・決勝の配列から f を計算し、その平均を求めます。
  • 方法 3
  • 前の演習で使用した配列 f を使います。
  • f の各要素に、等確率で 1 または -1 を掛けます。
  • この新しい配列の平均を計算して検定統計量とします。
  • 方法 4
  • 水泳タイムの配列を受け取り f を計算する、シグネチャ compute_f(semi_times, final_times) の関数を定義します。
  • dcst.draw_perm_reps(semi_times, final_times, compute_f) を使って置換レプリケートを生成します。

指示

50 XP

選択肢