Les plus grandes évolutions dans un nom
Auparavant, vous avez ajouté une colonne « ratio
» pour décrire le rapport entre la fréquence d'un prénom de bébé d'une année à l'autre afin de décrire les changements dans la popularité d'un prénom. À présent, nous allons examiner un sous-ensemble de ces données, appelé « babynames_ratios_filtered
», afin d'étudier plus en détail les noms qui ont connu les plus fortes hausses de popularité au cours des années consécutives.
babynames_ratios_filtered <- babynames_fraction %>%
arrange(name, year) %>%
group_by(name) %>%
mutate(ratio = fraction / lag(fraction)) %>%
filter(fraction >= 0.00001)
Cet exercice fait partie du cours
Manipulation de données avec dplyr
Instructions
- Pour chaque nom figurant dans les données, veuillez conserver l'observation (l'année) présentant la valeur
ratio
la plus élevée ; veuillez noter que les données sont déjà regroupées parname
. - Triez la colonne
ratio
par ordre décroissant. - Filtrez davantage les données
babynames_ratios_filtered
en filtrant la colonnefraction
afin d'afficher uniquement les résultats supérieurs ou égaux à0.001
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
babynames_ratios_filtered %>%
# Extract the largest ratio from each name
___
# Sort the ratio column in descending order
___
# Filter for fractions greater than or equal to 0.001
___