MulaiMulai sekarang secara gratis

Left join pertanyaan dan tag

Tiga himpunan data survei Stack Overflow adalah questions, question_tags, dan tags:

  • questions: berisi ID dan skor, yaitu berapa kali pertanyaan mendapat upvote; data hanya mencakup pertanyaan berbasis R
  • question_tags: berisi ID tag untuk setiap pertanyaan dan id pertanyaannya
  • tags: berisi id tag dan nama tag, yang dapat digunakan untuk mengidentifikasi subjek tiap pertanyaan, seperti ggplot2 atau dplyr

Dalam latihan ini, kita akan menggabungkan himpunan data tersebut dan mengganti nilai NA pada kolom-kolom penting.

Perhatikan bahwa kita akan menggunakan left_join dalam latihan ini untuk memastikan semua pertanyaan tetap dipertahankan, termasuk yang tidak memiliki tag terkait. Namun, karena kita tahu data questions semuanya terkait R, kita akan memberi tag R secara manual pada pertanyaan-pertanyaan ini dengan replace_na.

Latihan ini adalah bagian dari kursus

Menggabungkan Data dengan dplyr

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Join the questions and question_tags tables
questions %>%
  ___
Edit dan Jalankan Kode