ComeçarComece de graça

Média de respostas por pergunta

A tabela que você criou no último exercício já foi carregada como tagged_answers. Você pode usar essa tabela para descobrir, em média, quantas respostas cada pergunta recebe.

tagged_answers <- question_answer_counts %>%
    inner_join(question_tags, by = c("id" = "question_id")) %>%
    inner_join(tags, by = c("tag_id" = "id"))

Algumas variáveis importantes dessa tabela incluem: n, o número de respostas de cada pergunta, e tag_name, o nome de cada tag associada a cada pergunta.

Vamos usar alguns dos nossos verbos favoritos do dplyr para descobrir quantas respostas cada pergunta recebe, em média.

Este exercício faz parte do curso

Combinando dados com dplyr

Ver curso

Instruções do exercício

  • Agregue a tabela tagged_answers por tag_name.
  • Faça um summarize em tagged_answers para obter a contagem de questions e average_answers.
  • Ordene a coluna questions resultante em ordem decrescente.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

tagged_answers %>%
  # Aggregate by tag_name
  ___  %>%
  # Summarize questions and average_answers
  summarize(questions = ___,
            average_answers = ___) %>%
  # Sort the questions in descending order
  ___  
Editar e executar o código