LoslegenKostenlos loslegen

Die größten Sprünge in einem Namen

Zuvor hast du eine ratio Spalte hinzugefügt, um das Verhältnis der Häufigkeit eines Babynamens zwischen aufeinanderfolgenden Jahren zu beschreiben, um die Veränderungen in der Beliebtheit eines Namens zu beschreiben. Jetzt wirst du dir eine Teilmenge dieser Daten ansehen, die babynames_ratios_filtered genannt wird, um die Namen genauer zu untersuchen, die in aufeinanderfolgenden Jahren die größten Popularitätssprünge erlebt haben.

babynames_ratios_filtered <- babynames_fraction %>%

                     arrange(name, year) %>%

                     group_by(name) %>%

                     mutate(ratio = fraction / lag(fraction)) %>%

                     filter(fraction >= 0.00001)

Diese Übung ist Teil des Kurses

Datenmanipulation mit dplyr

Kurs anzeigen

Anleitung zur Übung

  • Behalte von jedem Namen in den Daten die Beobachtung (das Jahr) mit dem größten ratio; beachte, dass die Daten bereits nach name gruppiert sind.
  • Sortiere die Spalte ratio in absteigender Reihenfolge.
  • Filtere die Daten von babynames_ratios_filtered weiter, indem du die Spalte fraction so filterst, dass nur Ergebnisse angezeigt werden, die größer oder gleich 0.001 sind.

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

babynames_ratios_filtered %>%
  # Extract the largest ratio from each name 
  ___
  # Sort the ratio column in descending order 
  ___
  # Filter for fractions greater than or equal to 0.001
  ___
Code bearbeiten und ausführen