Fazendo left join entre perguntas e tags
Três dos conjuntos de dados da pesquisa do Stack Overflow são questions, question_tags e tags:
questions: um ID e a pontuação, ou seja, quantas vezes a pergunta recebeu upvote; os dados incluem apenas perguntas relacionadas a Rquestion_tags: um ID de tag para cada pergunta e o id da perguntatags: um id de tag e o nome da tag, que pode ser usado para identificar o assunto de cada pergunta, como ggplot2 ou dplyr
Neste exercício, vamos combinar esses conjuntos de dados e substituir NAs em campos importantes.
Perceba que usaremos left_joins neste exercício para garantir que mantenhamos todas as perguntas, mesmo as que não têm uma tag correspondente. No entanto, como sabemos que os dados de questions são todos de R, vamos marcar manualmente essas perguntas como de R com replace_na.
Este exercício faz parte do curso
Combinando dados com dplyr
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Join the questions and question_tags tables
questions %>%
___