Die größten Sprünge in einem Namen
Zuvor hast du eine ratio
Spalte hinzugefügt, um das Verhältnis der Häufigkeit eines Babynamens zwischen aufeinanderfolgenden Jahren zu beschreiben, um die Veränderungen in der Beliebtheit eines Namens zu beschreiben. Jetzt wirst du dir eine Teilmenge dieser Daten ansehen, die babynames_ratios_filtered
genannt wird, um die Namen genauer zu untersuchen, die in aufeinanderfolgenden Jahren die größten Popularitätssprünge erlebt haben.
babynames_ratios_filtered <- babynames_fraction %>%
arrange(name, year) %>%
group_by(name) %>%
mutate(ratio = fraction / lag(fraction)) %>%
filter(fraction >= 0.00001)
Diese Übung ist Teil des Kurses
Datenmanipulation mit dplyr
Anleitung zur Übung
- Behalte von jedem Namen in den Daten die Beobachtung (das Jahr) mit dem größten
ratio
; beachte, dass die Daten bereits nachname
gruppiert sind. - Sortiere die Spalte
ratio
in absteigender Reihenfolge. - Filtere die Daten von
babynames_ratios_filtered
weiter, indem du die Spaltefraction
so filterst, dass nur Ergebnisse angezeigt werden, die größer oder gleich0.001
sind.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
babynames_ratios_filtered %>%
# Extract the largest ratio from each name
___
# Sort the ratio column in descending order
___
# Filter for fractions greater than or equal to 0.001
___