Gemiddeld aantal antwoorden per vraag
De tabel die je in de vorige oefening hebt gemaakt, is voor je ingeladen als tagged_answers. Je kunt deze tabel gebruiken om te bepalen hoeveel antwoorden een vraag gemiddeld krijgt.
tagged_answers <- question_answer_counts %>%
inner_join(question_tags, by = c("id" = "question_id")) %>%
inner_join(tags, by = c("tag_id" = "id"))
Een paar belangrijke variabelen in deze tabel zijn: n, het aantal antwoorden voor elke vraag, en tag_name, de naam van elke tag die aan een vraag is gekoppeld.
Laten we een paar favoriete dplyr-verben gebruiken om uit te zoeken hoeveel antwoorden een vraag gemiddeld krijgt.
Deze oefening maakt deel uit van de cursus
Data samenvoegen met dplyr
Oefeninstructies
- Agregeer de tabel
tagged_answersoptag_name. - Vat
tagged_answerssamen om het aantalquestionsen deaverage_answerste krijgen. - Sorteer de resulterende kolom
questionsin aflopende volgorde.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
tagged_answers %>%
# Aggregate by tag_name
___ %>%
# Summarize questions and average_answers
summarize(questions = ___,
average_answers = ___) %>%
# Sort the questions in descending order
___