Soruları ve etiketleri left join ile birleştirme
Stack Overflow anket veri kümelerinden üçünü kullanacağız: questions, question_tags ve tags:
questions: bir ID ve puan (sorunun kaç kez upvote aldığı); veriler yalnızca R ile ilgili soruları içerirquestion_tags: her soru için bir etiket ID'si ve sorunun id'sitags: bir etiket id'si ve etiketin adı; bu ad her sorunun konusunu (ör. ggplot2 veya dplyr) belirlemek için kullanılabilir
Bu egzersizde bu veri kümelerini bir araya getirecek ve önemli alanlardaki NA'leri değiştireceğiz.
Bu egzersizde tüm soruları — eşleşen bir etiketi olmayanlar da dahil — korumak için left_join kullanacağımızı unutma. Ancak questions verisinin tamamen R ile ilgili olduğunu bildiğimiz için, bunları replace_na ile elle R sorusu olarak etiketlemek isteyeceğiz.
Bu egzersiz
dplyr ile Veri Birleştirme
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Join the questions and question_tags tables
questions %>%
___