1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rによる推測の基礎

Connected

演習

ブートストラップ百分位法による区間

前の演習の主なポイントは、元の標本の \(\hat{p}\) と再標本化(ブートストラップ)による \(\hat{p}^*\) の距離が、元の \(\hat{p}\) が母集団の真の比率からどれだけ離れているかを測る指標になる、ということでした。

同じばらつきは、別の方法でも測定できます。先ほどと同様に、もし \(\hat{p}\) が真の母数に十分近ければ、再標本化(ブートストラップ)した \(\hat{p}^*\) は、真の母数と重なるようなばらつきを示します。

標本の \(\hat{p}\) の中央値95%を測るのに \(\pm 2 SE\) を使う代わりに、再標本化した \(\hat{p}^*\) の上位2.5%と下位2.5%を取り除いて中央部分を見つけることができます。なお、この2つ目のブートストラップ区間の作り方は、95%区間だけでなく、90%や99%の信頼区間を作るときにも直感的に拡張できます。

ブートストラップした再標本 one_poll_boot と、「はい」と回答した比率 p_hat がワークスペースに用意されています。

指示1 / 3

undefined XP
  • 1
    • コードを実行して、前の演習で扱った t 区間を思い出しましょう。
    • one_poll_boot に含まれるブートストラップされた \(\hat{p}^*\) の 95 パーセント区間を計算します。
      • stat の 2.5% 分位点で下限を計算するために、p を 0.025 に設定して集約します。
      • 上限も同様の方法で計算します。
  • 2

    同じ計算を infer の便利関数 get_confidence_interval() を使って行いましょう。区間には level = 0.95 を使い、出力は percentile_ci という名前にします。

  • 3
    • ブートストラップされた比率の分布を visualize() で可視化し、中央の95パーセントをハイライトします。
      • ハイライトする領域の endpoints は percentile_ci に設定します。
      • direction は "between" に設定し、両端の間を強調表示します。