Left join pertanyaan dan tag
Tiga himpunan data survei Stack Overflow adalah questions, question_tags, dan tags:
questions: berisi ID dan skor, yaitu berapa kali pertanyaan mendapat upvote; data hanya mencakup pertanyaan berbasis Rquestion_tags: berisi ID tag untuk setiap pertanyaan dan id pertanyaannyatags: berisi id tag dan nama tag, yang dapat digunakan untuk mengidentifikasi subjek tiap pertanyaan, seperti ggplot2 atau dplyr
Dalam latihan ini, kita akan menggabungkan himpunan data tersebut dan mengganti nilai NA pada kolom-kolom penting.
Perhatikan bahwa kita akan menggunakan left_join dalam latihan ini untuk memastikan semua pertanyaan tetap dipertahankan, termasuk yang tidak memiliki tag terkait. Namun, karena kita tahu data questions semuanya terkait R, kita akan memberi tag R secara manual pada pertanyaan-pertanyaan ini dengan replace_na.
Latihan ini adalah bagian dari kursus
Menggabungkan Data dengan dplyr
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Join the questions and question_tags tables
questions %>%
___