LoslegenKostenlos loslegen

Left Join von Fragen und Tags

Drei der Stack-Overflow-Umfragedatensätze sind questions, question_tags und tags:

  • questions: eine ID und der Score, also wie oft die Frage upgevotet wurde; die Daten enthalten nur R-bezogene Fragen
  • question_tags: eine Tag-ID für jede Frage und die ID der Frage
  • tags: eine Tag-ID und der Tag-Name, mit dem sich das Thema jeder Frage identifizieren lässt, z. B. ggplot2 oder dplyr

In dieser Übung setzen wir diese Datensätze zusammen und ersetzen NAs in wichtigen Feldern.

Beachte, dass wir in dieser Übung left_joins verwenden, um sicherzustellen, dass wir alle Fragen behalten, auch solche ohne zugehörigen Tag. Da wir aber wissen, dass die questions-Daten ausschließlich R-Fragen enthalten, möchten wir diese manuell als R-Fragen mit replace_na taggen.

Diese Übung ist Teil des Kurses

Daten mit dplyr verknüpfen

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Join the questions and question_tags tables
questions %>%
  ___
Code bearbeiten und ausführen