1. Учиться
  2. /
  3. Courses
  4. /
  5. Rによる推測の基礎

Connected

Exercise

性差別のランダム化

男性と女性の人数(履歴書の枚数に相当)と、昇進者の人数(マネージャーが昇進させられたのは35人まで)が固定されている状況を考えます。

この演習では、前の演習の5回ではなく、1000回の反復で帰無統計量のランダム化分布を作成します。確認ですが、関心のある統計量は性別間の昇進割合の差(男性の割合マイナス女性の割合)です。元のデータセットから、男性と女性で昇進率がどの程度違うかを計算できます。infer の specify-hypothesis-generate-calculate ワークフローを使えば、同じ統計量を計算できますが、単一の数値ではなく分布全体を得られます。この演習では、元のデータセットから得られた単一の数値を、シミュレーションで作られた分布と比較します。

Инструкции 1 / 3

undefined XP
    1
    2
    3
  • 観測された昇進率の差を計算します。
    • sex でグループ化します。
    • 各性別の昇進割合を、promote == "promoted" の mean() で要約して計算します。要約変数名は prop_prom とします。
    • 性別間の割合の差を、もう一度要約して stat を prop_prom の diff() に設定して計算します。