Durchschnittliche Antworten pro Frage
Die Tabelle, die du in der letzten Aufgabe erstellt hast, wurde als tagged_answers für dich vorab geladen. Mit dieser Tabelle kannst du ermitteln, wie viele Antworten eine Frage durchschnittlich bekommt.
tagged_answers <- question_answer_counts %>%
inner_join(question_tags, by = c("id" = "question_id")) %>%
inner_join(tags, by = c("tag_id" = "id"))
Einige wichtige Variablen in dieser Tabelle sind: n, die Anzahl der Antworten pro Frage, und tag_name, der Name jedes Tags, das einer Frage zugeordnet ist.
Lass uns ein paar unserer Lieblingsverben aus dplyr nutzen, um herauszufinden, wie viele Antworten eine Frage im Durchschnitt bekommt.
Diese Übung ist Teil des Kurses
<Kurs>Daten mit dplyr verknüpfen</Kurs>Übungsanweisungen
- Aggregiere die Tabelle
tagged_answersnachtag_name. - Fasse
tagged_answersso zusammen, dass du die Anzahl derquestionsund dieaverage_answerserhältst. - Sortiere die resultierende Spalte
questionsin absteigender Reihenfolge.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
tagged_answers %>%
# Aggregate by tag_name
___ %>%
# Summarize questions and average_answers
summarize(questions = ___,
average_answers = ___) %>%
# Sort the questions in descending order
___