CommencerCommencer gratuitement

Jointure à gauche entre questions et tags

Trois jeux de données de l’enquête Stack Overflow sont questions, question_tags et tags :

  • questions : un identifiant et le score (c’est‑à‑dire le nombre de votes positifs) ; les données ne comprennent que des questions liées à R
  • question_tags : un identifiant de tag pour chaque question et l’identifiant de la question
  • tags : un identifiant de tag et le nom du tag, qui permet d’identifier le sujet de chaque question, comme ggplot2 ou dplyr

Dans cet exercice, vous allez rassembler ces jeux de données et remplacer les NA dans des champs importants.

Notez que nous utiliserons des left_join dans cet exercice afin de conserver toutes les questions, même celles sans tag correspondant. Cependant, comme nous savons que les données questions portent toutes sur R, nous allons étiqueter manuellement ces questions comme étant des questions R avec replace_na.

Cet exercice fait partie du cours

Assembler des données avec dplyr

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Join the questions and question_tags tables
questions %>%
  ___
Modifier et exécuter le code