Die größten Sprünge in der Namensverwendung

In einem vorherigen Teil des Kurses hast du eine Spalte ratio hinzugefügt, um das Verhältnis der Häufigkeit eines Babynamens zwischen aufeinanderfolgenden Jahren zu beschreiben und so die Veränderungen in der Beliebtheit eines Namens darzustellen. Jetzt schaust du dir einen Teil dieser Daten an, babynames_ratios_filtered, um genauer herauszufinden, welche Namen in aufeinanderfolgenden Jahren den größten Sprung in der Beliebtheit gemacht haben.

babynames_ratios_filtered <- babynames_fraction %>%

                     arrange(name, year) %>%

                     group_by(name) %>%

                     mutate(ratio = fraction / lag(fraction)) %>%

                     filter(fraction >= 0.00001)

Diese Übung ist Teil des Kurses

<Kurs>Datenbearbeitung mit dplyr </Kurs>

Übungsanweisungen

Nimm aus jedem Namen in den Daten die Beobachtung (das Jahr) mit dem größten Wert für ratio heraus. Die Daten sind bereits nach name sortiert.
Sortiere die Spalte ratio in absteigender Reihenfolge.
Filtere die Daten babynames_ratios_filtered weiter, indem du die Spalte fraction so filterst, dass nur Ergebnisse angezeigt werden, die größer oder gleich 0.001 sind.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

babynames_ratios_filtered %>%
  # Extract the largest ratio from each name 
  ___
  # Sort the ratio column in descending order 
  ___
  # Filter for fractions greater than or equal to 0.001
  ___

Code bearbeiten und ausführen

Diese Übung ist Teil des Kurses

<Kurs>Datenbearbeitung mit dplyr </Kurs>

Geringe SchwierigkeitSchwierigkeitsgrad

4.8+

Kurs kostenlos starten

Lerne Verben kennen, mit denen du deine Daten umwandeln kannst, darunter „select“, „filter“, „arrange“ und „mutate“. Du wirst diese Funktionen nutzen, um den Datensatz der Bezirke anzupassen, bestimmte Beobachtungen anzusehen und Fragen zu den Daten zu beantworten.

Exercise 1: Daten mit dplyr erkunden Exercise 2: Deine Daten verstehen Exercise 3: Spalten auswählen Exercise 4: Die Verben „filter“ und „arrange“Exercise 5: Beobachtungen organisieren Exercise 6: Nach Bedingungen filtern Exercise 7: Filtern und Anordnen Exercise 8: Das Verb „mutate“Exercise 9: Die Anzahl der Beamten berechnen Exercise 10: Berechnung des Frauenanteils in einem Bezirk Exercise 11: Mutate, filter und arrange

Jetzt, wo du weißt, wie du deine Daten umwandeln kannst, willst du bestimmt mehr darüber erfahren, wie du deine Daten zusammenfassen kannst, damit sie besser zu verstehen sind. Du lernst eine Reihe von Funktionen kennen, mit denen du viele Beobachtungen in deinen Daten machen und zusammenfassen kannst, darunter count, group_by, summarize, ungroup und slice_min/slice_max.

Exercise 1: Das Verb count Exercise 2: Nach Region zählen Exercise 3: Die Einwohner nach Bundesstaaten zählen Exercise 4: Mutieren und zählen Exercise 5: Die Verben „group_by“, „summarize“ und „ungroup“Exercise 6: Zusammenfassen Exercise 7: Nach Bundesstaaten zusammenfassen Exercise 8: Nach Bundesstaat und Region zusammenfassen Exercise 9: Die Verben slice_min und slice_max Exercise 10: Einen Bezirk aus jeder Region auswählen Exercise 11: Den Staat mit dem niedrigsten Einkommen in jeder Region finden Exercise 12: summarize, slice_max und count verwenden

Erlerne fortgeschrittene Methoden zum Auswählen und Umwandeln von Spalten. Finde außerdem heraus, was hinter den Hilfsfunktionen steckt, die Kriterien für die Spalten festlegen, die du auswählen möchtest. Auch auf das Verb „rename“ werden wir näher eingehen.

Exercise 1: Auswählen Exercise 2: Spalten auswählen Exercise 3: Hilfsfunktionen Exercise 4: Das Verb „rename“Exercise 5: Eine Spalte nach dem Zählen umbenennen Exercise 6: Eine Spalte als Teil von select umbenennen Exercise 7: Das Verb „relocate“Exercise 8: relocate verwenden Exercise 9: Zwischen den vier Verben wählen

Arbeite mit einem neuen Datensatz, der die Namen von Babys enthält, die jedes Jahr in den USA geboren werden. Lerne, wie du gruppierte Mutationen und Fensterfunktionen nutzen kannst, um komplexere Fragen zu deinen Daten zu stellen und zu beantworten. Nutze außerdem eine Kombination aus dplyr und ggplot2, um interessante Diagramme zu erstellen und dir deine Daten noch genauer anzuschauen.

Exercise 1: Die Daten zu Babynamen Exercise 2: Nach einem Jahr filtern und sortieren Exercise 3: Die beliebtesten Namen jedes Jahres finden Exercise 4: Visualisierung der Namen mit ggplot2 Exercise 5: Gruppierte Mutationen Exercise 6: Das Jahr mit dem häufigsten Vorkommen finden Exercise 7: Die Summe und das Maximum für jeden Namen hinzufügen Exercise 8: Visualisierung der normalisierten Veränderung der Beliebtheit Exercise 9: Fensterfunktionen Exercise 10: Verwendung von Verhältnissen zur Beschreibung der Häufigkeit eines Namens Exercise 11: Die größten Sprünge in der Namensverwendung

Aktuelle Übung

Exercise 12: Herzlichen Glückwunsch!