LoslegenKostenlos starten

Left Join von Fragen und Tags

Drei der Stack-Overflow-Umfragedatensätze sind questions, question_tags und tags:

  • questions: eine ID und der Score, also wie oft die Frage upgevotet wurde; die Daten enthalten nur R-bezogene Fragen
  • question_tags: eine Tag-ID für jede Frage und die ID der Frage
  • tags: eine Tag-ID und der Tag-Name, mit dem sich das Thema jeder Frage identifizieren lässt, z. B. ggplot2 oder dplyr

In dieser Übung setzen wir diese Datensätze zusammen und ersetzen NAs in wichtigen Feldern.

Beachte, dass wir in dieser Übung left_joins verwenden, um sicherzustellen, dass wir alle Fragen behalten, auch solche ohne zugehörigen Tag. Da wir aber wissen, dass die questions-Daten ausschließlich R-Fragen enthalten, möchten wir diese manuell als R-Fragen mit replace_na taggen.

Diese Übung ist Teil des Kurses

<Kurs>Daten mit dplyr verknüpfen</Kurs>
Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Join the questions and question_tags tables
questions %>%
  ___
Code bearbeiten und ausführen