1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Suy luận cho dữ liệu phân loại trong R

Connected

Bài tập

Kiểm định độ phù hợp (goodness of fit)

Giả thuyết không trong kiểm định độ phù hợp là một danh sách các giá trị tham số cụ thể cho từng tỷ lệ. Trong phân tích của bạn, giả thuyết tương đương là Luật Benford áp dụng cho phân phối chữ số đầu tiên của tổng số phiếu ở cấp thành phố. Bạn có thể viết như sau:

$$ H_0: p_1 = .30, p_2 = .18, \ldots, p_9 = .05 $$

Trong đó \(p_1\) là chiều cao của cột đầu tiên trong biểu đồ cột của Benford. Giả thuyết đối là có ít nhất một trong các tỷ lệ này khác đi; tức là phân phối chữ số đầu tiên không tuân theo Luật Benford.

Trong bài tập này, bạn sẽ dùng mô phỏng để xây dựng phân phối rỗng của các thống kê chi-bình phương mà bạn sẽ quan sát nếu thực sự các đếm này tuân theo Luật Benford.

Hướng dẫn

100 XP
  • Kiểm tra p_benford bằng cách in nó ra màn hình.
  • Bắt đầu với iran, tính thống kê chi-bình phương bằng cách dùng chisq_stat. Lưu ý bạn phải chỉ định biến trong data frame sẽ đóng vai trò biến phản hồi cũng như vector xác suất mà bạn muốn so sánh.
  • Xây dựng phân phối rỗng với 500 mẫu của thống kê Chisq thông qua mô phỏng dưới giả thuyết rỗng point rằng vector tỷ lệ p là p_benford. Lưu các thống kê thu được vào null.