1. Învăţa
  2. /
  3. Courses
  4. /
  5. Rによる推測の基礎

Connected

exercise

ランダム化分布におけるサンプルサイズ

元の差別データとほぼ同じ比率差をもつ新しいデータセットを2つ用意しました。ただし、一方のデータセット(disc_small)は元データの3分の1のサイズ、もう一方(disc_big)は元データの10倍のサイズです。

さらに、以前と同じ置換(パーミュテーション)コードを小さい・大きいデータセットに対して実行し、昇進率の置換差の小さい・大きい分布(それぞれ disc_small_perm と disc_big_perm)を作成しました。

この演習では、サンプルサイズが大きく異なると差がどのように変動するかを把握するために、これら2つの分布を使います。特に、各プロットの x 軸における変動範囲に注目してください。

Instrucțiuni 1 / 3

undefined XP
  • 1
    • 小さいデータセット disc_small を集計します。つまり、count() を呼び出して sex 列と promote 列を渡し、クロス集計表を作成します。
    • 大きいデータセット disc_big でも同様に行います。
  • 2
    • 小さい置換データセット disc_perm_small を使い、stat をプロットします。
    • binwidth を 0.01 とするヒストグラム層を追加します。
    • geom_vline() で縦線を追加し、x 軸の切片を diff_orig_small にします。
  • 3

    同じプロットをもう一度描きます。今度は大きいデータセット disc_perm_big を使い、x 軸の切片は diff_orig_big にします。