1. Learn
  2. /
  3. Курси
  4. /
  5. Manipulation de données avec dplyr

Connected

вправа

Plus fortes hausses pour un prénom

Précédemment, vous avez ajouté une colonne ratio pour décrire le rapport entre la fréquence d'un prénom d'une année à l'autre, afin de mesurer les variations de popularité d'un prénom. Maintenant, vous allez examiner un sous-ensemble de ces données, appelé babynames_ratios_filtered, pour analyser plus en détail les prénoms qui ont connu les plus fortes hausses de popularité d'une année à l'autre.

babynames_ratios_filtered <- babynames_fraction %>%
                     arrange(name, year) %>%
                     group_by(name) %>%
                     mutate(ratio = fraction / lag(fraction)) %>%
                     filter(fraction >= 0.00001)

Інструкції

100 XP
  • Pour chaque prénom dans les données, conservez l'observation (l'année) avec la plus grande valeur de ratio ; notez que les données sont déjà groupées par name.
  • Triez la colonne ratio en ordre décroissant.
  • Filtrez davantage les données babynames_ratios_filtered en appliquant un filtre sur la colonne fraction pour n'afficher que les résultats supérieurs ou égaux à 0.001.