1. Learn
  2. /
  3. Courses
  4. /
  5. Nền tảng Suy luận trong R

Connected

Exercise

Tóm tắt chi phí cơ hội (2)

Bây giờ bạn đã tạo được phân phối hoán vị ngẫu nhiên, hãy dùng nó để đánh giá xem chênh lệch tỷ lệ quan sát được có nhất quán với chênh lệch theo giả thuyết không hay không. Bạn sẽ đo mức độ nhất quán (hoặc thiếu nhất quán) này bằng p-value, tức là tỷ lệ các chênh lệch sau hoán vị nhỏ hơn hoặc bằng chênh lệch quan sát được.

Bộ dữ liệu đã hoán vị và thống kê quan sát gốc có sẵn trong không gian làm việc của bạn lần lượt là opp_perm và diff_orig.

Hãy dùng visualize và get_p_value với các hàm dựng sẵn của infer. Nhớ rằng các thống kê theo giả thuyết rơi ở phía trên chênh lệch gốc, nên p-value (đại diện cho tần suất một giá trị theo giả thuyết “cực đoan” hơn) được tính bằng cách đếm số giá trị theo giả thuyết less hơn chênh lệch gốc.

Instructions

100 XP
  • Trước tiên visualize phân phối lấy mẫu của các thống kê đã hoán vị, đánh dấu vị trí obs_stat = diff_orig, và tô màu các giá trị phía dưới bằng lệnh direction = "less".
  • Sau đó get_p_value được tính là tỷ lệ các thống kê đã hoán vị có direction = "less" so với obs_stat = diff_orig.
  • Như một cách khác để tính p-value, dùng summarize() và mean() để tìm tỷ lệ số lần các chênh lệch đã hoán vị trong opp_perm (gọi là stat) nhỏ hơn hoặc bằng chênh lệch quan sát (gọi là diff_orig).
  • Bạn có thể kiểm tra hiểu biết của mình bằng cách thử: direction = "greater", direction = "two_sided", và direction = "less" trước khi Gửi câu trả lời cho cả visualize và get_p_value.