1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu với dplyr

Connected

Bài tập

Kết hợp summarize, slice_max và count

Trong chương này, bạn đã học sáu động từ dplyr liên quan đến tổng hợp: count(), group_by(), summarize(), ungroup(), slice_max() và slice_min(). Trong bài tập này, bạn sẽ kết hợp chúng để trả lời câu hỏi:

Có bao nhiêu bang có số người sống ở khu vực metro nhiều hơn khu vực ngoài metro?

Hãy nhớ rằng cột metro có một trong hai giá trị "Metro" (khu vực thành phố mật độ cao) hoặc "Nonmetro" (khu vực ngoại ô và nông thôn).

counties_selected <- counties %>%
  select(state, metro, population)

Hướng dẫn 1/3

undefined XP
  • 1

    Với mỗi tổ hợp state và metro, hãy tính tổng dân số và đặt tên là total_pop.

  • 2

    Trích xuất hàng có dân số lớn nhất từ mỗi bang, đó sẽ là Metro hoặc Nonmetro.

  • 3

    Bỏ nhóm, sau đó đếm tần suất xuất hiện của Metro hoặc Nonmetro để xem có bao nhiêu bang có nhiều người sống ở các khu vực đó.