1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Manipulace s daty pomocí dplyr

Connected

cvičení

Největší skoky v popularitě jména

V předchozím kroku jsi přidal/a sloupec ratio, který popisuje poměr frekvence dětského jména mezi po sobě jdoucími roky a zachycuje změny v jeho popularitě. Teď se podíváš na podmnožinu těchto dat nazvanou babynames_ratios_filtered, abys blíže prozkoumal/a jména, která zaznamenala největší skoky v popularitě v po sobě jdoucích letech.

babynames_ratios_filtered <- babynames_fraction %>%
                     arrange(name, year) %>%
                     group_by(name) %>%
                     mutate(ratio = fraction / lag(fraction)) %>%
                     filter(fraction >= 0.00001)

Pokyny

100 XP
  • Pro každé jméno v datech ponech pouze pozorování (rok) s nejvyšší hodnotou ratio; data jsou již seskupená podle name.
  • Seřaď sloupec ratio sestupně.
  • Dále vyfiltruj data babynames_ratios_filtered tak, aby sloupec fraction zobrazoval pouze hodnoty větší nebo rovné 0.001.