Left Join von Fragen und Tags
Drei der Stack-Overflow-Umfragedatensätze sind questions, question_tags und tags:
questions: eine ID und der Score, also wie oft die Frage upgevotet wurde; die Daten enthalten nur R-bezogene Fragenquestion_tags: eine Tag-ID für jede Frage und die ID der Fragetags: eine Tag-ID und der Tag-Name, mit dem sich das Thema jeder Frage identifizieren lässt, z. B. ggplot2 oder dplyr
In dieser Übung setzen wir diese Datensätze zusammen und ersetzen NAs in wichtigen Feldern.
Beachte, dass wir in dieser Übung left_joins verwenden, um sicherzustellen, dass wir alle Fragen behalten, auch solche ohne zugehörigen Tag. Da wir aber wissen, dass die questions-Daten ausschließlich R-Fragen enthalten, möchten wir diese manuell als R-Fragen mit replace_na taggen.
Diese Übung ist Teil des Kurses
<Kurs>Daten mit dplyr verknüpfen</Kurs>Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Join the questions and question_tags tables
questions %>%
___