1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nền tảng Suy luận trong R

Connected

Bài tập

Hoán vị để kiểm tra phân biệt giới tính

Hãy nhớ rằng chúng ta đang xét một tình huống trong đó số lượng nam và nữ là cố định (đại diện cho các hồ sơ ứng tuyển) và số người được thăng chức cũng cố định (các quản lý chỉ có thể thăng chức cho 35 người).

Trong bài này, bạn sẽ tạo một phân phối hoán vị của thống kê theo giả thuyết không với 1000 lần lặp, thay vì chỉ 5 như ở bài trước. Nhắc lại: thống kê quan tâm là chênh lệch tỷ lệ được thăng chức giữa hai giới (tức là tỷ lệ của nam trừ tỷ lệ của nữ). Từ bộ dữ liệu gốc, bạn có thể tính mức chênh lệch tỷ lệ thăng chức giữa nam và nữ. Sử dụng quy trình specify-hypothesis-generate-calculate trong infer, bạn có thể tính cùng thống kê đó, nhưng thay vì nhận một con số, bạn sẽ có cả một phân phối. Trong bài này, bạn sẽ so sánh con số đơn lẻ từ bộ dữ liệu gốc với phân phối được tạo ra bằng mô phỏng.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Tính chênh lệch quan sát được về tỷ lệ thăng chức.
    • Nhóm theo sex.
    • Tính tỷ lệ được thăng chức cho mỗi giới bằng cách tóm tắt với mean() của promote == "promoted". Đặt tên biến tóm tắt là prop_prom.
    • Tính chênh lệch tỷ lệ giữa hai giới bằng cách tóm tắt lần nữa, gán stat bằng diff() của prop_prom.