Perguntas e tags de junção à esquerda
Três dos conjuntos de dados da pesquisa do Stack Overflow são questions, question_tags e tags:
questions: um ID e a pontuação, ou quantas vezes a pergunta foi votada positivamente; os dados incluem apenas perguntas baseadas em Rquestion_tags: uma tag ID para cada pergunta e o ID da perguntatagsID da tag: um ID da tag e o nome da tag, que podem ser usados para identificar o assunto de cada pergunta, como ggplot2 ou dplyr
Neste exercício, juntaremos esses conjuntos de dados e substituiremos NAs em campos importantes.
Observe que usaremos left_joins neste exercício para garantir que manteremos todas as perguntas, mesmo aquelas sem uma tag correspondente. No entanto, como sabemos que os dados do questions são todos dados do R, queremos marcá-los manualmente como perguntas do R com replace_na.
Este exercício faz parte do curso
Unindo dados com o dplyr
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Join the questions and question_tags tables
questions %>%
___