1. Learn
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶサンプリング

Connected

Exercise

サンプリング分布 vs. ブートストラップ分布

サンプリング分布とブートストラップ分布は密接に関連しています。母集団から繰り返しサンプリングできる状況(実際にはまれです)では、両者を連続して作成し、どのように関係しているかを確認すると役立ちます。

ここで扱う統計量は、楽曲の popularity スコアの平均です。

spotify_population(全データセット)と spotify_sample(spotify_population からランダムに 500 行を抽出したサンプル)が用意されています。pandas と numpy は通常のエイリアスで読み込まれています。

Instructions 1/2

undefined XP
  • 1
    • for ループを使って 2000 回のレプリケートからなるサンプリング分布を作成します。
    • 母集団から復元抽出なしで 500 行をサンプリングし、popularity の平均を計算します。
  • 2
    • サンプルから復元抽出ありで 500 行をサンプリングし、popularity の平均を計算して、2000 回のレプリケートからなるブートストラップ分布を作成します。