Preguntas y etiquetas
Tres de los conjuntos de datos de la encuesta Stack Overflow son questions
, question_tags
y tags
:
questions
ID y la puntuación, o cuántas veces se ha votado la pregunta; los datos sólo incluyen preguntas basadas en R.question_tags
una etiqueta ID para cada pregunta y el identificador de la preguntatags
un identificador de etiqueta y el nombre de la etiqueta, que puede utilizarse para identificar el tema de cada pregunta, como ggplot2 o dplyr
En este ejercicio, uniremos estos conjuntos de datos y sustituiremos NAs en campos importantes.
Tenga en cuenta que en este ejercicio utilizaremos left_join
s para asegurarnos de que guardamos todas las preguntas, incluso las que no tienen una etiqueta correspondiente. Sin embargo, como sabemos que los datos de questions
son todos datos R, querremos etiquetarlos manualmente como preguntas R con replace_na
.
Este ejercicio forma parte del curso
Unir datos con dplyr
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Join the questions and question_tags tables
questions %>%
___