Left join tra domande e tag
Tre dei dataset del sondaggio di Stack Overflow sono questions, question_tags e tags:
questions: un ID e lo score, cioè quante volte la domanda è stata votata positivamente; i dati includono solo domande su Rquestion_tags: un ID di tag per ciascuna domanda e l'id della domandatags: un id di tag e il nome del tag, che può essere usato per identificare l’argomento di ogni domanda, come ggplot2 o dplyr
In questo esercizio metteremo insieme questi dataset e sostituiremo gli NA nei campi importanti.
Nota che useremo dei left_join in questo esercizio per assicurarci di mantenere tutte le domande, anche quelle senza un tag corrispondente. Tuttavia, dato che sappiamo che i dati di questions riguardano tutti R, vogliamo etichettarle manualmente come domande su R con replace_na.
Questo esercizio fa parte del corso
Unire i dati con dplyr
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Join the questions and question_tags tables
questions %>%
___