LoslegenKostenlos loslegen

Die größten Sprünge in der Namensverwendung

In einem vorherigen Teil des Kurses hast du eine Spalte ratio hinzugefügt, um das Verhältnis der Häufigkeit eines Babynamens zwischen aufeinanderfolgenden Jahren zu beschreiben und so die Veränderungen in der Beliebtheit eines Namens darzustellen. Jetzt schaust du dir einen Teil dieser Daten an, babynames_ratios_filtered, um genauer herauszufinden, welche Namen in aufeinanderfolgenden Jahren den größten Sprung in der Beliebtheit gemacht haben.

babynames_ratios_filtered <- babynames_fraction %>%

                     arrange(name, year) %>%

                     group_by(name) %>%

                     mutate(ratio = fraction / lag(fraction)) %>%

                     filter(fraction >= 0.00001)

Diese Übung ist Teil des Kurses

Datenbearbeitung mit dplyr

Kurs anzeigen

Anleitung zur Übung

  • Nimm aus jedem Namen in den Daten die Beobachtung (das Jahr) mit dem größten Wert für ratio heraus. Die Daten sind bereits nach name sortiert.
  • Sortiere die Spalte ratio in absteigender Reihenfolge.
  • Filtere die Daten babynames_ratios_filtered weiter, indem du die Spalte fraction so filterst, dass nur Ergebnisse angezeigt werden, die größer oder gleich 0.001 sind.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

babynames_ratios_filtered %>%
  # Extract the largest ratio from each name 
  ___
  # Sort the ratio column in descending order 
  ___
  # Filter for fractions greater than or equal to 0.001
  ___
Code bearbeiten und ausführen