Rata-rata jawaban per pertanyaan
Tabel yang Anda buat pada latihan terakhir telah dimuat sebelumnya sebagai tagged_answers. Anda dapat menggunakan tabel ini untuk menentukan, rata-rata, berapa banyak jawaban yang diterima setiap pertanyaan.
tagged_answers <- question_answer_counts %>%
inner_join(question_tags, by = c("id" = "question_id")) %>%
inner_join(tags, by = c("tag_id" = "id"))
Beberapa variabel penting dari tabel ini meliputi: n, jumlah jawaban untuk setiap pertanyaan, dan tag_name, nama setiap tag yang terkait dengan setiap pertanyaan.
Mari kita gunakan beberapa verba dplyr favorit untuk mengetahui berapa banyak jawaban yang diterima setiap pertanyaan secara rata-rata.
Latihan ini adalah bagian dari kursus
Menggabungkan Data dengan dplyr
Petunjuk latihan
- Agregasikan tabel
tagged_answersberdasarkantag_name. - Ringkas
tagged_answersuntuk mendapatkan jumlahquestionsdanaverage_answers. - Urutkan kolom
questionsyang dihasilkan secara menurun.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
tagged_answers %>%
# Aggregate by tag_name
___ %>%
# Summarize questions and average_answers
summarize(questions = ___,
average_answers = ___) %>%
# Sort the questions in descending order
___