Jointure à gauche entre questions et tags
Trois jeux de données de l’enquête Stack Overflow sont questions, question_tags et tags :
questions: un identifiant et le score (c’est‑à‑dire le nombre de votes positifs) ; les données ne comprennent que des questions liées à Rquestion_tags: un identifiant de tag pour chaque question et l’identifiant de la questiontags: un identifiant de tag et le nom du tag, qui permet d’identifier le sujet de chaque question, comme ggplot2 ou dplyr
Dans cet exercice, vous allez rassembler ces jeux de données et remplacer les NA dans des champs importants.
Notez que nous utiliserons des left_join dans cet exercice afin de conserver toutes les questions, même celles sans tag correspondant. Cependant, comme nous savons que les données questions portent toutes sur R, nous allons étiqueter manuellement ces questions comme étant des questions R avec replace_na.
Cet exercice fait partie du cours
Assembler des données avec dplyr
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Join the questions and question_tags tables
questions %>%
___