Die größten Sprünge in der Namensverwendung
In einem vorherigen Teil des Kurses hast du eine Spalte ratio hinzugefügt, um das Verhältnis der Häufigkeit eines Babynamens zwischen aufeinanderfolgenden Jahren zu beschreiben und so die Veränderungen in der Beliebtheit eines Namens darzustellen. Jetzt schaust du dir einen Teil dieser Daten an, babynames_ratios_filtered, um genauer herauszufinden, welche Namen in aufeinanderfolgenden Jahren den größten Sprung in der Beliebtheit gemacht haben.
babynames_ratios_filtered <- babynames_fraction %>%
arrange(name, year) %>%
group_by(name) %>%
mutate(ratio = fraction / lag(fraction)) %>%
filter(fraction >= 0.00001)
Diese Übung ist Teil des Kurses
<Kurs>Datenbearbeitung mit dplyr </Kurs>Übungsanweisungen
- Nimm aus jedem Namen in den Daten die Beobachtung (das Jahr) mit dem größten Wert für
ratioheraus. Die Daten sind bereits nachnamesortiert. - Sortiere die Spalte
ratioin absteigender Reihenfolge. - Filtere die Daten
babynames_ratios_filteredweiter, indem du die Spaltefractionso filterst, dass nur Ergebnisse angezeigt werden, die größer oder gleich0.001sind.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
babynames_ratios_filtered %>%
# Extract the largest ratio from each name
___
# Sort the ratio column in descending order
___
# Filter for fractions greater than or equal to 0.001
___