1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Suy luận cho dữ liệu phân loại trong R

Connected

Bài tập

Một p-value, theo hai cách

Bạn đã thấy rằng thường có hai cách để xây dựng phân phối giả thuyết rỗng: qua tính toán và qua xấp xỉ toán học. Kiểm định độ phù hợp chi-bình phương cũng không ngoại lệ. Phân phối xấp xỉ ở đây lại là "phân phối Chi-squared" với bậc tự do bằng số lượng nhóm trừ đi một.

Trong bài này, bạn sẽ so sánh hai cách tiếp cận này để tính p-value nhằm đo lường mức độ nhất quán giữa phân phối chữ số đầu tiên của Iran với Định luật Benford. Lưu ý: thống kê quan sát được mà bạn đã tạo ở bài trước được lưu trong không gian làm việc dưới tên chi_obs_stat.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Tính bậc tự do của xấp xỉ chi-bình phương bằng cách lấy vector first_digit từ dữ liệu iran, sau đó tính số lượng nhóm bằng hàm nlevels() rồi trừ đi một.
  • Dùng null để vẽ phân phối của các thống kê chi-bình phương bằng biểu đồ mật độ. Thêm một đường thẳng đứng biểu thị giá trị quan sát được, rồi chồng lên đường cong xấp xỉ chi-bình phương với bậc tự do, tô màu xanh lam.