ブートストラップによる t-信頼区間

前の演習から、次の2点がわかりました。

元の標本から再標本化することで、\(\hat{p}\) に伴う変動性を測定できます。
\(\hat{p}\) の変動性がわかれば、真の比率がどの程度離れているかを測る指標として使えます。

ここでいう「近さの割合」（ここでは95%）は、母集団パラメータに近い標本がどれくらいの頻度で選ばれるかを指します。個々のデータセットがパラメータに近いのか遠いのかはわかりませんが、長い目で見れば、収集した標本の95%は、真の母集団パラメータから \(2SE\) 以内の推定値を与えるはずだ、ということはわかっています。

単一の世論調査 one_poll の投票結果と、1000個のブートストラップ再標本からのデータ one_poll_boot がワークスペースに用意されています。これらは、この章の前半に扱った Experiment 2 に基づいています。

前の演習と同様、統計量の変動性について述べるとき、その数値は「標準誤差（standard error）」と呼ばれます。

\(\hat{p}\) を計算して p_hat に代入します。summarize() の呼び出しでは、stat を vote が "yes" に等しいことの平均として計算します。
\(\hat{p} \pm 2SE\) を計算して、真のパラメータにとって妥当な値の範囲（区間）を求めます。
- 信頼区間の lower 境界は、p_hat から stat の標準誤差の2倍を引いたものです。標準誤差の計算には sd() を使います。
- upper 境界は、p_hat に標準誤差の2倍を加えたものです。

연습 문제

ブートストラップによる t-信頼区間

지침

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}연습 문제

지침

연습 문제