Les plus grandes évolutions dans un nom
Auparavant, vous avez ajouté une colonne « ratio » pour décrire le rapport entre la fréquence d'un prénom de bébé d'une année à l'autre afin de décrire les changements dans la popularité d'un prénom. À présent, nous allons examiner un sous-ensemble de ces données, appelé « babynames_ratios_filtered », afin d'étudier plus en détail les noms qui ont connu les plus fortes hausses de popularité au cours des années consécutives.
babynames_ratios_filtered <- babynames_fraction %>%
arrange(name, year) %>%
group_by(name) %>%
mutate(ratio = fraction / lag(fraction)) %>%
filter(fraction >= 0.00001)
Cet exercice fait partie du cours
Manipulation de données avec dplyr
Instructions
- Pour chaque nom figurant dans les données, veuillez conserver l'observation (l'année) présentant la valeur
ratiola plus élevée ; veuillez noter que les données sont déjà regroupées parname. - Triez la colonne
ratiopar ordre décroissant. - Filtrez davantage les données
babynames_ratios_filtereden filtrant la colonnefractionafin d'afficher uniquement les résultats supérieurs ou égaux à0.001.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
babynames_ratios_filtered %>%
# Extract the largest ratio from each name
___
# Sort the ratio column in descending order
___
# Filter for fractions greater than or equal to 0.001
___