CommencerCommencer gratuitement

Nombre moyen de réponses par question

La table que vous avez créée dans l’exercice précédent a été préchargée sous le nom tagged_answers. Vous pouvez l’utiliser pour déterminer, en moyenne, combien de réponses reçoit chaque question.

tagged_answers <- question_answer_counts %>%
    inner_join(question_tags, by = c("id" = "question_id")) %>%
    inner_join(tags, by = c("tag_id" = "id"))

Parmi les variables importantes de cette table : n, le nombre de réponses pour chaque question, et tag_name, le nom de chaque balise associée à chaque question.

Utilisons quelques-uns de nos verbes dplyr préférés pour découvrir combien de réponses chaque question reçoit en moyenne.

Cet exercice fait partie du cours

Assembler des données avec dplyr

Afficher le cours

Instructions

  • Agrégez la table tagged_answers par tag_name.
  • Résumez tagged_answers pour obtenir le nombre de questions et average_answers.
  • Triez la colonne questions résultante par ordre décroissant.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

tagged_answers %>%
  # Aggregate by tag_name
  ___  %>%
  # Summarize questions and average_answers
  summarize(questions = ___,
            average_answers = ___) %>%
  # Sort the questions in descending order
  ___  
Modifier et exécuter le code