1. Learn
  2. /
  3. Courses
  4. /
  5. Rによる推測の基礎

Connected

Exercise

標本からの再標本化

母比率の推定値が標本ごとにどれくらい変動するかを調べるために、2つのサンプリング実験を行います。

最初の実験では、母集団から繰り返し標本を抽出してシミュレーションします。2つ目の実験では、最初の実験で得た1つの標本を選び、その標本から繰り返し再標本化します。これは「ブートストラップ」と呼ばれる方法です。詳しくは次のとおりです。

実験1: 候補者Xに投票する人の真の割合が 0.6 であると仮定します。母集団から30人を繰り返し抽出し、$\hat{p}$(標本比率)の変動を測定します。

実験2: 同じ母集団からサイズ30の標本を1つだけ取り出します。元の標本から(復元抽出で!)30人を繰り返し抽出し、$\hat{p}^*$(再標本比率)の変動を測定します。

最初の実験は母集団を知っていることが前提で、実務では通常不可能である点が重要です。2つ目は標本データだけに依存するため、どの統計量にも容易に適用できます。幸い、これから見るように、標本内の「成功」の割合である \(\hat{p}\) の変動は、母集団から抽出しても標本から再標本化しても、おおよそ同程度になります。

母集団からサイズ30の無作為標本を1000個作成しました。結果のデータフレーム all_polls はワークスペースで利用できます。始める前に中身を確認してください。

Instructions 1/3

undefined XP
    1
    2
    3
  • 1000個の元の各標本について標本比率を計算し、ex1_props に代入します。
    • poll でグループ化します。
    • vote が "yes" に等しいケースの mean() を計算し、stat として集計します。