1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶ実験計画法

Connected

演習

NHANES データの再サンプリング

NHANES のデータは、米国人口を代表するように特別に選ばれた標本単位(人)から収集されています。ここでは、異なるサンプリング手法の感覚をつかむために、nhanes_final データセットをいくつかの方法で再サンプリングしてみましょう。

単純無作為抽出は、dplyr の slice_sample() で実行できます。入力としてデータセットと、サンプリングする行数(整数)を受け取ります。

層化抽出は、group_by() と slice_sample() を組み合わせることで実行できます。group_by() で指定した各グループから n 件ずつ抽出します。

sampling パッケージの cluster() はクラスターサンプルを作成します。データセット名、クラスター変数として用いるセット内の変数(例: c("variable") のように名前を文字列でベクトルにして渡します)、選択するクラスター数、そしてメソッドを指定します。

指示

100 XP
  • slice_sample() を使って nhanes_final から 2500 行を抽出し、nhanes_srs として保存します。
  • group_by() と slice_sample() を使って nhanes_stratified を作成します。riagendr で層化し、各性別から 2000 件ずつ選びます。count() を使って nhanes_stratified の性別変数を確認し、意図どおりになっていることを確かめてください。
  • sampling パッケージを読み込みます。cluster() を使って、nhanes_final を "indhhin2" で 6 クラスターに分け、メソッドは "srswor" を指定します。結果を nhanes_cluster に代入します。