1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Suy luận cho dữ liệu phân loại trong R

Connected

Bài tập

Trích xuất chữ số đầu tiên I

Để xem xét câu hỏi về gian lận bầu cử, hãy bắt đầu bằng cách tạo một cột dữ liệu mới chứa chữ số đầu tiên của tổng số phiếu bầu. Bạn sẽ cần một hàm tùy chỉnh đã được tạo sẵn cho bạn là get_first(). Lõi của hàm này là substr(), hàm sẽ nhận một chuỗi và trích ra một phần của nó gọi là substring.

Sau khi tạo biến mới chỉ chứa chữ số đầu tiên, bạn có thể hình dung mức độ tuân theo Luật Benford bằng cách vẽ một biểu đồ cột.

Hướng dẫn

100 XP
  • Xem get_first() hoạt động thế nào bằng cách chỉ gõ tên hàm (không có dấu ngoặc đơn). Tất cả những gì nó làm là xử lý đầu ra từ substr() để nó trở thành một factor.
  • Tạo (mutate) một cột mới trong data frame iran tên là first_digit chứa chữ số đầu tiên của tổng số phiếu bầu theo từng thành phố.
  • Kiểm tra xem get_first() đã hoạt động chưa. Từ dữ liệu iran, chọn ra các cột total_votes_cast và first_digit và in chúng ra màn hình.
  • Vẽ một biểu đồ cột để trực quan hóa phân phối của chữ số đầu tiên.