Aan de slagGa gratis aan de slag

Left joinen van questions en tags

Drie van de Stack Overflow-enquêtedatasets zijn questions, question_tags en tags:

  • questions: een ID en de score (hoe vaak de vraag is ge-upvote); de data bevat alleen R-gerelateerde vragen
  • question_tags: een tag-ID voor elke vraag en de id van de vraag
  • tags: een tag-id en de naam van de tag, die je kunt gebruiken om het onderwerp van elke vraag te identificeren, zoals ggplot2 of dplyr

In deze oefening voegen we deze datasets samen en vervangen we NA's in belangrijke velden.

Let op: we gebruiken left_joins in deze oefening om alle vragen te behouden, ook die zonder bijbehorende tag. Maar omdat we weten dat de data in questions allemaal R-data is, willen we deze handmatig labelen als R-vragen met replace_na.

Deze oefening maakt deel uit van de cursus

Data samenvoegen met dplyr

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Join the questions and question_tags tables
questions %>%
  ___
Code bewerken en uitvoeren