Risposte medie per domanda
La tabella che hai creato nell'ultimo esercizio è stata precaricata come tagged_answers. Puoi usare questa tabella per determinare, in media, quante risposte riceve ciascuna domanda.
tagged_answers <- question_answer_counts %>%
inner_join(question_tags, by = c("id" = "question_id")) %>%
inner_join(tags, by = c("tag_id" = "id"))
Alcune variabili importanti in questa tabella includono: n, il numero di risposte per ogni domanda, e tag_name, il nome di ciascun tag associato a ogni domanda.
Usiamo alcuni dei nostri verbi preferiti di dplyr per scoprire quante risposte ottiene in media ciascuna domanda.
Questo esercizio fa parte del corso
Unire i dati con dplyr
Istruzioni dell'esercizio
- Aggrega la tabella
tagged_answerspertag_name. - Esegui il summarize di
tagged_answersper ottenere il conteggio diquestionseaverage_answers. - Ordina la colonna risultante
questionsin ordine decrescente.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
tagged_answers %>%
# Aggregate by tag_name
___ %>%
# Summarize questions and average_answers
summarize(questions = ___,
average_answers = ___) %>%
# Sort the questions in descending order
___