1. Learn
  2. /
  3. Courses
  4. /
  5. Rによる推測の基礎

Connected

Exercise

ブートストラップによる t-信頼区間

前の演習から、次の2点がわかりました。

  1. 元の標本から再標本化することで、\(\hat{p}\) に伴う変動性を測定できます。
  2. \(\hat{p}\) の変動性がわかれば、真の比率がどの程度離れているかを測る指標として使えます。

ここでいう「近さの割合」(ここでは95%)は、母集団パラメータに近い標本がどれくらいの頻度で選ばれるかを指します。個々のデータセットがパラメータに近いのか遠いのかはわかりませんが、長い目で見れば、収集した標本の95%は、真の母集団パラメータから \(2SE\) 以内の推定値を与えるはずだ、ということはわかっています。

単一の世論調査 one_poll の投票結果と、1000個のブートストラップ再標本からのデータ one_poll_boot がワークスペースに用意されています。これらは、この章の前半に扱った Experiment 2 に基づいています。

前の演習と同様、統計量の変動性について述べるとき、その数値は「標準誤差(standard error)」と呼ばれます。

Instructions

100 XP
  • \(\hat{p}\) を計算して p_hat に代入します。summarize() の呼び出しでは、stat を vote が "yes" に等しいことの平均として計算します。
  • \(\hat{p} \pm 2SE\) を計算して、真のパラメータにとって妥当な値の範囲(区間)を求めます。
    • 信頼区間の lower 境界は、p_hat から stat の標準誤差の2倍を引いたものです。標準誤差の計算には sd() を使います。
    • upper 境界は、p_hat に標準誤差の2倍を加えたものです。