1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶサンプリング

Connected

演習

異なるサンプルで要約統計量を計算する

これで3種類のサンプル(単純、層化、クラスター)がそろいました。各サンプルの点推定値を母集団のパラメータと比較してみましょう。つまり、各サンプルで同じ要約統計量を計算し、それを母集団の要約統計量と比べます。

ここでは、会社への満足度が退職に影響するかを見ていきます。具体的には、RelationshipSatisfaction の各値ごとに、会社を離れた従業員(Attrition の値が "Yes")の割合を計算します。

attrition_pop、attrition_srs、attrition_strat、attrition_clust が利用可能です。dplyr は読み込まれています。

指示1 / 4

undefined XP
  • 1
    • RelationshipSatisfaction の水準でグループ化します。
    • Attrition が "Yes" に等しいケースの平均として、mean_attrition という列を計算して要約します。
  • 2
    • 今度は単純無作為抽出サンプル attrition_srs について、各関係満足度グループの退職割合を計算します。
  • 3
    • 今度は層化サンプル attrition_strat について、各関係満足度グループの退職割合を計算します。
  • 4
    • 今度はクラスターサンプル attrition_clust について、各関係満足度グループの退職割合を計算します。