1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Suy luận cho dữ liệu phân loại trong R

Connected

Bài tập

Phân tích theo tỉnh

Mặc dù tổng số phiếu toàn quốc là quan trọng nhất, bạn vẫn có thể đi sâu hơn vào dữ liệu này bằng cách khai thác thông tin địa lý. Trong bài tập này, bạn sẽ xem kết quả khác nhau theo từng tỉnh như thế nào.

Ahmadinejad có thắng trên toàn quốc không, hay có những tỉnh mà ứng viên về nhì lại dẫn đầu? Để trả lời câu hỏi này, hãy bắt đầu bằng cách tạo một bộ dữ liệu ở cấp tỉnh.

Hướng dẫn

100 XP
  • Bắt đầu với iran, nhóm theo tỉnh, rồi tổng hợp với hai biến: tổng số phiếu của ứng viên về nhất và tổng số phiếu của ứng viên về nhì. Đặt tên từng cột mới theo tên ứng viên.
  • Kiểm tra province_totals.
  • Lọc province_totals để lấy mọi dòng mà ứng viên về nhì nhận được nhiều phiếu hơn ứng viên về nhất.