ComeçarComece de graça

Fazendo left join entre perguntas e tags

Três dos conjuntos de dados da pesquisa do Stack Overflow são questions, question_tags e tags:

  • questions: um ID e a pontuação, ou seja, quantas vezes a pergunta recebeu upvote; os dados incluem apenas perguntas relacionadas a R
  • question_tags: um ID de tag para cada pergunta e o id da pergunta
  • tags: um id de tag e o nome da tag, que pode ser usado para identificar o assunto de cada pergunta, como ggplot2 ou dplyr

Neste exercício, vamos combinar esses conjuntos de dados e substituir NAs em campos importantes.

Perceba que usaremos left_joins neste exercício para garantir que mantenhamos todas as perguntas, mesmo as que não têm uma tag correspondente. No entanto, como sabemos que os dados de questions são todos de R, vamos marcar manualmente essas perguntas como de R com replace_na.

Este exercício faz parte do curso

Combinando dados com dplyr

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Join the questions and question_tags tables
questions %>%
  ___
Editar e executar o código