1. 学ぶ
  2. /
  3. コース
  4. /
  5. R によるカテゴリカルデータの推測

Connected

演習

信頼区間(CI)を構築する

リサンプリングによって p-hat がどのように変動するかを1例見ましたが、ばらつきを適切に見積もるには、これを何度も繰り返す必要があります。ここでは、信頼区間の構築に用いる標準誤差(SE)を推定するために、完全なブートストラップ分布を計算します。さらに、infer の calculate() 動詞を使って、多くのデータセットから多くの統計量を計算する処理を簡潔にします。

まずは calculate の出力を確認しましょう。この関数は、データフレームを「stat」列と、それに対応する「replicate」列の2列だけに要約します。

ブートストラップ分布をプロットすると、釣鐘型の形状になっているはずです。この形状のおかげで、SE を2つ分、足し引きすることで95%区間を得られます。

指示1 / 4

undefined XP
    1
    2
    3
    4
  • 次の手順で boot_dist というブートストラップ分布を作成します。
  • 成功が "High" の自信を意味する consci 変数に関心があることを specify で指定します。
  • 500 個のブートストラップ複製を generate します。
  • stat を "prop" に設定して、割合の統計量を calculate します。