Left join de preguntas y etiquetas
Tres de los conjuntos de datos de la encuesta de Stack Overflow son questions, question_tags y tags:
questions: un ID y el score, es decir, cuántas veces se ha votado positivamente la pregunta; los datos solo incluyen preguntas sobre Rquestion_tags: un id de etiqueta para cada pregunta y el id de la propia preguntatags: un id de etiqueta y el nombre de la etiqueta, que sirve para identificar el tema de cada pregunta, como ggplot2 o dplyr
En este ejercicio, vamos a combinar estos conjuntos de datos y a reemplazar los NA en los campos importantes.
Ten en cuenta que usaremos left_join en este ejercicio para asegurarnos de conservar todas las preguntas, incluso las que no tienen una etiqueta correspondiente. Sin embargo, como sabemos que los datos de questions son todos sobre R, queremos etiquetarlas manualmente como preguntas de R con replace_na.
Este ejercicio forma parte del curso
Uniones de datos con dplyr
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Join the questions and question_tags tables
questions %>%
___