Aan de slagGa gratis aan de slag

Grootste sprongen in een naam

Eerder heb je een kolom ratio toegevoegd die de verhouding beschrijft tussen de frequentie van een babynaam in opeenvolgende jaren, om zo veranderingen in de populariteit van een naam te meten. Nu bekijk je een subset van die gegevens, babynames_ratios_filtered, om verder in te zoomen op de namen die de grootste sprongen in populariteit maakten in opeenvolgende jaren.

babynames_ratios_filtered <- babynames_fraction %>%
                     arrange(name, year) %>%
                     group_by(name) %>%
                     mutate(ratio = fraction / lag(fraction)) %>%
                     filter(fraction >= 0.00001)

Deze oefening maakt deel uit van de cursus

Data manipulatie met dplyr

Cursus bekijken

Oefeninstructies

  • Bewaar voor elke naam in de data de observatie (het jaar) met de grootste ratio; let op: de data is al gegroepeerd op name.
  • Sorteer de kolom ratio in aflopende volgorde.
  • Filter de data babynames_ratios_filtered verder door de kolom fraction te filteren zodat alleen resultaten van 0.001 of hoger worden getoond.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

babynames_ratios_filtered %>%
  # Extract the largest ratio from each name 
  ___
  # Sort the ratio column in descending order 
  ___
  # Filter for fractions greater than or equal to 0.001
  ___
Code bewerken en uitvoeren