Die größten Sprünge in der Namensverwendung
In einem vorherigen Teil des Kurses hast du eine Spalte ratio hinzugefügt, um das Verhältnis der Häufigkeit eines Babynamens zwischen aufeinanderfolgenden Jahren zu beschreiben und so die Veränderungen in der Beliebtheit eines Namens darzustellen. Jetzt schaust du dir einen Teil dieser Daten an, babynames_ratios_filtered, um genauer herauszufinden, welche Namen in aufeinanderfolgenden Jahren den größten Sprung in der Beliebtheit gemacht haben.
babynames_ratios_filtered <- babynames_fraction %>%
arrange(name, year) %>%
group_by(name) %>%
mutate(ratio = fraction / lag(fraction)) %>%
filter(fraction >= 0.00001)
Diese Übung ist Teil des Kurses
Datenbearbeitung mit dplyr
Anleitung zur Übung
- Nimm aus jedem Namen in den Daten die Beobachtung (das Jahr) mit dem größten Wert für
ratioheraus. Die Daten sind bereits nachnamesortiert. - Sortiere die Spalte
ratioin absteigender Reihenfolge. - Filtere die Daten
babynames_ratios_filteredweiter, indem du die Spaltefractionso filterst, dass nur Ergebnisse angezeigt werden, die größer oder gleich0.001sind.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
babynames_ratios_filtered %>%
# Extract the largest ratio from each name
___
# Sort the ratio column in descending order
___
# Filter for fractions greater than or equal to 0.001
___