1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô hình phân cấp và hiệu ứng hỗn hợp trong R

Connected

Bài tập

Khám phá dữ liệu tội ác thù hằn ở NY

Bang New York báo cáo số vụ tội ác thù hằn xảy ra với người dân ở từng quận (county). Trong nghiên cứu tình huống này, bạn sẽ kiểm tra xem số vụ tội ác thù hằn có thay đổi theo thời gian hay không. Các bài tập này có hai mục tiêu. Thứ nhất, chúng minh họa cách hồi quy hỗn hợp tổng quát (glmer()) có thể dùng cho dữ liệu đo lặp trong R. Thứ hai, chúng cung cấp thêm một ví dụ về việc dùng mô hình hiệu ứng hỗn hợp để suy luận thống kê.

Với quy mô dân số khác nhau giữa các quận của New York, bạn có thể hợp lý khi giả định cần có hệ số chặn hiệu ứng ngẫu nhiên (random-effect intercepts) từ trước (a priori). Tuy nhiên, bạn có cần hệ số dốc hiệu ứng ngẫu nhiên (random-effect slopes) không? Hãy vẽ dữ liệu để xem liệu xu hướng có khác nhau giữa các quận hay không. Ngoài ra, việc trực quan hóa dữ liệu sẽ giúp bạn “nhìn thấy” điều gì đang diễn ra.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Dùng data.frame hate, vẽ tổng số vụ tội ác thù hằn (y = TotalIncidents) theo thời gian (x = Year).
  • Nhóm theo County và thêm geom_line().