CommencerCommencez gratuitement

Nombre moyen de réponses par question

La table que vous avez créée dans l’exercice précédent a été préchargée sous le nom tagged_answers. Vous pouvez l’utiliser pour déterminer, en moyenne, combien de réponses reçoit chaque question.

tagged_answers <- question_answer_counts %>%
    inner_join(question_tags, by = c("id" = "question_id")) %>%
    inner_join(tags, by = c("tag_id" = "id"))

Parmi les variables importantes de cette table : n, le nombre de réponses pour chaque question, et tag_name, le nom de chaque balise associée à chaque question.

Utilisons quelques-uns de nos verbes dplyr préférés pour découvrir combien de réponses chaque question reçoit en moyenne.

Cet exercice fait partie du cours

<cours>Assembler des données avec dplyr</cours>
Voir le cours

Instructions de l’exercice

  • Agrégez la table tagged_answers par tag_name.
  • Résumez tagged_answers pour obtenir le nombre de questions et average_answers.
  • Triez la colonne questions résultante par ordre décroissant.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

tagged_answers %>%
  # Aggregate by tag_name
  ___  %>%
  # Summarize questions and average_answers
  summarize(questions = ___,
            average_answers = ___) %>%
  # Sort the questions in descending order
  ___  
Modifier et exécuter le code