Média de respostas por pergunta
A tabela que você criou no último exercício foi pré-carregada para você como tagged_answers
. Você pode usar essa tabela para determinar, em média, quantas respostas cada pergunta recebe.
tagged_answers <- question_answer_counts %>%
inner_join(question_tags, by = c("id" = "question_id")) %>%
inner_join(tags, by = c("tag_id" = "id"))
Algumas das variáveis importantes dessa tabela incluem: n
O número de respostas para cada pergunta e tag_name
, o nome de cada tag associado a cada pergunta.
Vamos usar alguns de nossos verbos favoritos do dplyr para descobrir quantas respostas cada pergunta recebe em média.
Este exercício faz parte do curso
Unindo dados com o dplyr
Instruções de exercício
- Agregue a tabela
tagged_answers
portag_name
. - Resuma
tagged_answers
para obter a contagem dequestions
eaverage_answers
. - Classifique a coluna
questions
resultante em ordem decrescente.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
tagged_answers %>%
# Aggregate by tag_name
___ %>%
# Summarize questions and average_answers
summarize(questions = ___,
average_answers = ___) %>%
# Sort the questions in descending order
___