Grootste sprongen in een naam
Eerder heb je een kolom ratio toegevoegd die de verhouding beschrijft tussen de frequentie van een babynaam in opeenvolgende jaren, om zo veranderingen in de populariteit van een naam te meten. Nu bekijk je een subset van die gegevens, babynames_ratios_filtered, om verder in te zoomen op de namen die de grootste sprongen in populariteit maakten in opeenvolgende jaren.
babynames_ratios_filtered <- babynames_fraction %>%
arrange(name, year) %>%
group_by(name) %>%
mutate(ratio = fraction / lag(fraction)) %>%
filter(fraction >= 0.00001)
Deze oefening maakt deel uit van de cursus
Data manipulatie met dplyr
Oefeninstructies
- Bewaar voor elke naam in de data de observatie (het jaar) met de grootste
ratio; let op: de data is al gegroepeerd opname. - Sorteer de kolom
ratioin aflopende volgorde. - Filter de data
babynames_ratios_filteredverder door de kolomfractionte filteren zodat alleen resultaten van0.001of hoger worden getoond.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
babynames_ratios_filtered %>%
# Extract the largest ratio from each name
___
# Sort the ratio column in descending order
___
# Filter for fractions greater than or equal to 0.001
___