1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô hình Tuyến tính Tổng quát (GLM) trong Python

Connected

Bài tập

Tính số đếm kỳ vọng

Ở các bài trước, bạn đã tính trung bình và phương sai của dữ liệu cua và thấy rằng chúng không bằng nhau. Trong bài này, bạn sẽ luyện tập một cách phân tích khác cho hiện tượng quá phân tán (overdispersion) bằng cách sử dụng trung bình đã tính và tính số đếm kỳ vọng cho một giá trị đếm nhất định, ví dụ số đếm bằng 0. Nói cách khác, với trung bình mẫu đã tính, ta kỳ vọng có bao nhiêu quan sát có số vệ tinh bằng 0 trong mẫu.

Hãy nhớ lại biểu đồ từ bộ dữ liệu crab nơi bạn có thể thấy rất nhiều số đếm bằng 0.

Nhắc lại rằng để tính số đếm kỳ vọng với một tham số cho trước, bạn có thể dùng phân phối Poisson được xác định bởi

$$ P(y)=\frac{\lambda^ye^{-\lambda}}{y!} $$

Bộ dữ liệu crab và giá trị trung bình đã tính sat_mean đã được nạp sẵn trong không gian làm việc.

Hướng dẫn

100 XP
  • Dùng trung bình đã tính sat_mean và số đếm bằng 0 \(y = 0\) để tính số đếm kỳ vọng bằng 0. Dùng math factorial().
  • Tính số quan sát có số đếm bằng 0 trong biến sat bằng sum() và tổng số quan sát trong mẫu bằng len().
  • In tỷ lệ giữa số quan sát có số đếm bằng 0 thực tế và tổng số quan sát.