1. Lära sig
  2. /
  3. Courses
  4. /
  5. Rによる推測の基礎

Connected

exercise

機会費用の要約 (2)

ランダム化分布を作成できたので、観測された比率の差が帰無仮説の差と一貫しているかどうかを評価します。この一貫性(または不一致)の度合いは、p値、つまり「並べ替えで得た差のうち、観測された差以下の割合」で測ります。

並べ替えたデータセットと元の観測統計量は、それぞれ opp_perm と diff_orig としてワークスペースに用意されています。

組み込みの infer 関数を使って、visualize と get_p_value を実行します。帰無分布の統計量は元の差より上側にあることを思い出してください。したがって、p値(帰無値がより「極端」である頻度を表します)は、元の差より less(小さい)である帰無値の数を数えて計算します。

Instruktioner

100 XP
  • まず、visualize で並べ替えによる統計量の標本分布を描画し、obs_stat = diff_orig の位置を示し、direction = "less" を指定してそれより小さい値を塗りつぶします。
  • 次に、get_p_value を使って、obs_stat = diff_orig より direction = "less" の並べ替え統計量の割合として p値を計算します。
  • p値を別の方法で計算するには、summarize() と mean() を使って、opp_perm(列名は stat)の並べ替え差が観測された差(diff_orig)以下となる割合を求めます。
  • 理解度を確認するために、提出前に visualize と get_p_value の両方で direction = "greater"、direction = "two_sided"、direction = "less" を試してみてもよいでしょう。