ComeçarComece gratuitamente

Média de respostas por pergunta

A tabela que você criou no último exercício foi pré-carregada para você como tagged_answers. Você pode usar essa tabela para determinar, em média, quantas respostas cada pergunta recebe.

tagged_answers <- question_answer_counts %>%

    inner_join(question_tags, by = c("id" = "question_id")) %>%

    inner_join(tags, by = c("tag_id" = "id"))

Algumas das variáveis importantes dessa tabela incluem: n O número de respostas para cada pergunta e tag_name, o nome de cada tag associado a cada pergunta.

Vamos usar alguns de nossos verbos favoritos do dplyr para descobrir quantas respostas cada pergunta recebe em média.

Este exercício faz parte do curso

Unindo dados com o dplyr

Ver Curso

Instruções de exercício

  • Agregue a tabela tagged_answers por tag_name.
  • Resuma tagged_answers para obter a contagem de questions e average_answers.
  • Classifique a coluna questions resultante em ordem decrescente.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

tagged_answers %>%
  # Aggregate by tag_name
  ___  %>%
  # Summarize questions and average_answers
  summarize(questions = ___,
            average_answers = ___) %>%
  # Sort the questions in descending order
  ___  
Editar e executar código