Left Join von Fragen und Tags
Drei der Stack-Overflow-Umfragedatensätze sind questions, question_tags und tags:
questions: eine ID und der Score, also wie oft die Frage upgevotet wurde; die Daten enthalten nur R-bezogene Fragenquestion_tags: eine Tag-ID für jede Frage und die ID der Fragetags: eine Tag-ID und der Tag-Name, mit dem sich das Thema jeder Frage identifizieren lässt, z. B. ggplot2 oder dplyr
In dieser Übung setzen wir diese Datensätze zusammen und ersetzen NAs in wichtigen Feldern.
Beachte, dass wir in dieser Übung left_joins verwenden, um sicherzustellen, dass wir alle Fragen behalten, auch solche ohne zugehörigen Tag. Da wir aber wissen, dass die questions-Daten ausschließlich R-Fragen enthalten, möchten wir diese manuell als R-Fragen mit replace_na taggen.
Diese Übung ist Teil des Kurses
Daten mit dplyr verknüpfen
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Join the questions and question_tags tables
questions %>%
___