1. 学ぶ
  2. /
  3. コース
  4. /
  5. Xử lý dữ liệu với dplyr

Connected

演習

Những cú nhảy lớn nhất của một cái tên

Trước đó, bạn đã thêm cột ratio để mô tả tỉ lệ giữa tần suất của một tên em bé ở hai năm liên tiếp nhằm thể hiện mức độ thay đổi về độ phổ biến của tên đó. Bây giờ, bạn sẽ xem một tập con của dữ liệu đó, gọi là babynames_ratios_filtered, để đi sâu vào các tên có mức tăng độ phổ biến lớn nhất giữa hai năm liên tiếp.

babynames_ratios_filtered <- babynames_fraction %>%
                     arrange(name, year) %>%
                     group_by(name) %>%
                     mutate(ratio = fraction / lag(fraction)) %>%
                     filter(fraction >= 0.00001)

指示

100 XP
  • Với mỗi tên trong dữ liệu, giữ lại quan sát (năm) có ratio lớn nhất; lưu ý dữ liệu đã được nhóm theo name.
  • Sắp xếp cột ratio theo thứ tự giảm dần.
  • Lọc tiếp dữ liệu babynames_ratios_filtered bằng cách lọc cột fraction để chỉ hiển thị các kết quả lớn hơn hoặc bằng 0.001.