Aan de slagGa gratis aan de slag

Gemiddeld aantal antwoorden per vraag

De tabel die je in de vorige oefening hebt gemaakt, is voor je ingeladen als tagged_answers. Je kunt deze tabel gebruiken om te bepalen hoeveel antwoorden een vraag gemiddeld krijgt.

tagged_answers <- question_answer_counts %>%
    inner_join(question_tags, by = c("id" = "question_id")) %>%
    inner_join(tags, by = c("tag_id" = "id"))

Een paar belangrijke variabelen in deze tabel zijn: n, het aantal antwoorden voor elke vraag, en tag_name, de naam van elke tag die aan een vraag is gekoppeld.

Laten we een paar favoriete dplyr-verben gebruiken om uit te zoeken hoeveel antwoorden een vraag gemiddeld krijgt.

Deze oefening maakt deel uit van de cursus

Data samenvoegen met dplyr

Cursus bekijken

Oefeninstructies

  • Agregeer de tabel tagged_answers op tag_name.
  • Vat tagged_answers samen om het aantal questions en de average_answers te krijgen.
  • Sorteer de resulterende kolom questions in aflopende volgorde.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

tagged_answers %>%
  # Aggregate by tag_name
  ___  %>%
  # Summarize questions and average_answers
  summarize(questions = ___,
            average_answers = ___) %>%
  # Sort the questions in descending order
  ___  
Code bewerken en uitvoeren