Nombre moyen de réponses par question
La table que vous avez créée dans l’exercice précédent a été préchargée sous le nom tagged_answers. Vous pouvez l’utiliser pour déterminer, en moyenne, combien de réponses reçoit chaque question.
tagged_answers <- question_answer_counts %>%
inner_join(question_tags, by = c("id" = "question_id")) %>%
inner_join(tags, by = c("tag_id" = "id"))
Parmi les variables importantes de cette table : n, le nombre de réponses pour chaque question, et tag_name, le nom de chaque balise associée à chaque question.
Utilisons quelques-uns de nos verbes dplyr préférés pour découvrir combien de réponses chaque question reçoit en moyenne.
Cet exercice fait partie du cours
Assembler des données avec dplyr
Instructions
- Agrégez la table
tagged_answerspartag_name. - Résumez
tagged_answerspour obtenir le nombre dequestionsetaverage_answers. - Triez la colonne
questionsrésultante par ordre décroissant.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
tagged_answers %>%
# Aggregate by tag_name
___ %>%
# Summarize questions and average_answers
summarize(questions = ___,
average_answers = ___) %>%
# Sort the questions in descending order
___