1. Learn
  2. /
  3. Cursuri
  4. /
  5. Manipularea datelor cu dplyr

Connected

exercițiu

Cele mai mari salturi pentru un nume

Anterior, ai adăugat o coloană ratio pentru a descrie raportul dintre frecvența unui nume de bebeluș în ani consecutivi și a surprinde astfel schimbările în popularitatea unui nume. Acum vei analiza un subset al acestor date, numit babynames_ratios_filtered, pentru a examina mai îndeaproape numele care au înregistrat cele mai mari salturi de popularitate în ani consecutivi.

babynames_ratios_filtered <- babynames_fraction %>%
                     arrange(name, year) %>%
                     group_by(name) %>%
                     mutate(ratio = fraction / lag(fraction)) %>%
                     filter(fraction >= 0.00001)

Instrucțiuni

100 XP
  • Din fiecare nume din date, păstrează observația (anul) cu cea mai mare valoare ratio; reține că datele sunt deja grupate după name.
  • Sortează coloana ratio în ordine descrescătoare.
  • Filtrează în continuare datele din babynames_ratios_filtered, păstrând doar înregistrările în care coloana fraction are valori mai mari sau egale cu 0.001.