Left joinen van questions en tags
Drie van de Stack Overflow-enquêtedatasets zijn questions, question_tags en tags:
questions: een ID en de score (hoe vaak de vraag is ge-upvote); de data bevat alleen R-gerelateerde vragenquestion_tags: een tag-ID voor elke vraag en de id van de vraagtags: een tag-id en de naam van de tag, die je kunt gebruiken om het onderwerp van elke vraag te identificeren, zoals ggplot2 of dplyr
In deze oefening voegen we deze datasets samen en vervangen we NA's in belangrijke velden.
Let op: we gebruiken left_joins in deze oefening om alle vragen te behouden, ook die zonder bijbehorende tag. Maar omdat we weten dat de data in questions allemaal R-data is, willen we deze handmatig labelen als R-vragen met replace_na.
Deze oefening maakt deel uit van de cursus
Data samenvoegen met dplyr
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Join the questions and question_tags tables
questions %>%
___