1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶサンプリング

Connected

演習

母集団と標本分布の平均

標本分布の便利な点のひとつは、定量化できることです。具体的には、その分布に対して要約統計量を計算できます。ここでは、標本分布の平均と、標本抽出で推定したい母集団パラメータとの関係を見ていきます。

3つの標本分布が用意されています。いずれも、従業員離職データセットから単純無作為抽出でサンプリングを行い、各サンプルで離職率の平均を計算しました。これを1000回繰り返して、離職率の平均の標本分布を作成しました。1つは各リプリケートの標本サイズが5、もう1つは50、さらにもう1つは500です。

attrition_pop、sampling_distribution_5、sampling_distribution_50、sampling_distribution_500 が利用可能です。dplyr は読み込まれています。

指示1 / 2

undefined XP
    1
    2
  • sampling_distribution_5 を使って、すべてのリプリケートにわたる mean_attrition(標本平均)の平均を計算し、mean_mean_attrition という列に保存します。
  • 同じ計算を sampling_distribution_50 と sampling_distribution_500 でも行います。