1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶサンプリング

Connected

演習

サンプリング分布 vs. ブートストラップ分布

サンプリング分布とブートストラップ分布は密接に関連しています。母集団から繰り返しサンプリングできる状況(実際にはまれです)では、両者の関係を理解するために、サンプリング分布とブートストラップ分布を順番に生成して見比べるとよいです。

ここで関心のある統計量は、楽曲の popularity スコアの平均です。

spotify_population(全データセット)と spotify_sample(元の標本を表す500行のみ)が利用可能で、dplyr は読み込まれています。

指示1 / 2

undefined XP
  • 1
    • 2000回のレプリケートでサンプリング分布を生成します。
    • 母集団から復元抽出なしで500行をサンプリングします。
    • 関心のある統計量(popularity の平均)を列 mean_popularity に計算します。
    • 統計量を取り出し、単一の数値(tibble ではない)にします。
  • 2
    • 2000回のレプリケートでブートストラップ分布を生成します。
    • 標本から復元抽出ありで500行をサンプリングします。
    • 関心のある統計量(popularity の平均)を列 mean_popularity に計算します。
    • 統計量を取り出し、単一の数値(tibble ではない)にします.