CommencerCommencer gratuitement

Les plus grandes évolutions dans un nom

Auparavant, vous avez ajouté une colonne « ratio » pour décrire le rapport entre la fréquence d'un prénom de bébé d'une année à l'autre afin de décrire les changements dans la popularité d'un prénom. À présent, nous allons examiner un sous-ensemble de ces données, appelé « babynames_ratios_filtered », afin d'étudier plus en détail les noms qui ont connu les plus fortes hausses de popularité au cours des années consécutives.

babynames_ratios_filtered <- babynames_fraction %>%

                     arrange(name, year) %>%

                     group_by(name) %>%

                     mutate(ratio = fraction / lag(fraction)) %>%

                     filter(fraction >= 0.00001)

Cet exercice fait partie du cours

Manipulation de données avec dplyr

Afficher le cours

Instructions

  • Pour chaque nom figurant dans les données, veuillez conserver l'observation (l'année) présentant la valeur ratio la plus élevée ; veuillez noter que les données sont déjà regroupées par name.
  • Triez la colonne ratio par ordre décroissant.
  • Filtrez davantage les données babynames_ratios_filtered en filtrant la colonne fraction afin d'afficher uniquement les résultats supérieurs ou égaux à 0.001.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

babynames_ratios_filtered %>%
  # Extract the largest ratio from each name 
  ___
  # Sort the ratio column in descending order 
  ___
  # Filter for fractions greater than or equal to 0.001
  ___
Modifier et exécuter le code