1. Nauka
  2. /
  3. Kursy
  4. /
  5. Manipulowanie danymi z dplyr

Connected

ćwiczenie

Największe skoki popularności imienia

Wcześniej dodano kolumnę ratio, która opisuje stosunek częstotliwości występowania imienia dziecka między kolejnymi latami – pozwala to śledzić zmiany popularności danego imienia. Teraz przyjrzysz się podzbiorowi tych danych o nazwie babynames_ratios_filtered, aby dokładniej zbadać imiona, których popularność najbardziej wzrosła w kolejnych latach.

babynames_ratios_filtered <- babynames_fraction %>%
                     arrange(name, year) %>%
                     group_by(name) %>%
                     mutate(ratio = fraction / lag(fraction)) %>%
                     filter(fraction >= 0.00001)

Instrukcje

100 XP
  • Dla każdego imienia w danych zatrzymaj obserwację (rok) z największą wartością ratio; pamiętaj, że dane są już pogrupowane według name.
  • Posortuj kolumnę ratio w kolejności malejącej.
  • Zawęź dane babynames_ratios_filtered, filtrując kolumnę fraction tak, aby wyświetlić tylko wyniki większe lub równe 0.001.