1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nền tảng Suy luận trong R

Connected

Bài tập

Tính p-value

Trong video, bạn đã học rằng p-value đo mức độ bất đồng giữa dữ liệu và giả thuyết không. Ở đây, bạn sẽ tính p-value cho bộ dữ liệu phân biệt đối xử gốc cũng như các phiên bản nhỏ và lớn, disc_small và disc_big.

Các chênh lệch tỷ lệ gốc đã có sẵn trong không gian làm việc của bạn, diff_orig, diff_orig_small, và diff_orig_big, cùng với các bộ dữ liệu hoán vị, disc_perm, disc_perm_small, và disc_perm_big.

Hãy nhớ rằng bạn chỉ quan tâm đến kiểm định một phía ở đây. Tức là, bạn đang cố trả lời câu hỏi: "Nam giới có khả năng được thăng chức cao hơn nữ giới không?"

Hướng dẫn

100 XP
  • Dùng visualize() và get_p_value() với các hàm dựng sẵn của infer. Hãy nhớ rằng các thống kê theo giả thuyết không nằm thấp hơn chênh lệch gốc, vì vậy p-value (biểu thị tần suất một giá trị theo giả thuyết không “cực đoan” hơn) được tính bằng cách đếm số giá trị theo giả thuyết không greater so với chênh lệch gốc.
  • Lặp lại cho bộ dữ liệu nhỏ, disc_perm_small, với chênh lệch quan sát được là diff_orig_small.
  • Lặp lại cho bộ dữ liệu lớn, disc_perm_big, với chênh lệch quan sát được là diff_orig_big.
  • Bạn có thể kiểm tra hiểu biết của mình bằng cách thử: direction = "greater", direction = "two_sided", và direction = "less" trước khi Gửi câu trả lời.