Média de respostas por pergunta
A tabela que você criou no último exercício já foi carregada como tagged_answers. Você pode usar essa tabela para descobrir, em média, quantas respostas cada pergunta recebe.
tagged_answers <- question_answer_counts %>%
inner_join(question_tags, by = c("id" = "question_id")) %>%
inner_join(tags, by = c("tag_id" = "id"))
Algumas variáveis importantes dessa tabela incluem: n, o número de respostas de cada pergunta, e tag_name, o nome de cada tag associada a cada pergunta.
Vamos usar alguns dos nossos verbos favoritos do dplyr para descobrir quantas respostas cada pergunta recebe, em média.
Este exercício faz parte do curso
Combinando dados com dplyr
Instruções do exercício
- Agregue a tabela
tagged_answersportag_name. - Faça um
summarizeemtagged_answerspara obter a contagem dequestionseaverage_answers. - Ordene a coluna
questionsresultante em ordem decrescente.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
tagged_answers %>%
# Aggregate by tag_name
___ %>%
# Summarize questions and average_answers
summarize(questions = ___,
average_answers = ___) %>%
# Sort the questions in descending order
___