Média de respostas por pergunta
A tabela que você criou no último exercício foi pré-carregada para você como tagged_answers. Você pode usar essa tabela para determinar, em média, quantas respostas cada pergunta recebe.
tagged_answers <- question_answer_counts %>%
inner_join(question_tags, by = c("id" = "question_id")) %>%
inner_join(tags, by = c("tag_id" = "id"))
Algumas das variáveis importantes dessa tabela incluem: n O número de respostas para cada pergunta e tag_name, o nome de cada tag associado a cada pergunta.
Vamos usar alguns de nossos verbos favoritos do dplyr para descobrir quantas respostas cada pergunta recebe em média.
Este exercício faz parte do curso
Unindo dados com o dplyr
Instruções do exercício
- Agregue a tabela
tagged_answersportag_name. - Resuma
tagged_answerspara obter a contagem dequestionseaverage_answers. - Classifique a coluna
questionsresultante em ordem decrescente.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
tagged_answers %>%
# Aggregate by tag_name
___ %>%
# Summarize questions and average_answers
summarize(questions = ___,
average_answers = ___) %>%
# Sort the questions in descending order
___