ComenzarEmpieza gratis

Left join de preguntas y etiquetas

Tres de los conjuntos de datos de la encuesta de Stack Overflow son questions, question_tags y tags:

  • questions: un ID y el score, es decir, cuántas veces se ha votado positivamente la pregunta; los datos solo incluyen preguntas sobre R
  • question_tags: un id de etiqueta para cada pregunta y el id de la propia pregunta
  • tags: un id de etiqueta y el nombre de la etiqueta, que sirve para identificar el tema de cada pregunta, como ggplot2 o dplyr

En este ejercicio, vamos a combinar estos conjuntos de datos y a reemplazar los NA en los campos importantes.

Ten en cuenta que usaremos left_join en este ejercicio para asegurarnos de conservar todas las preguntas, incluso las que no tienen una etiqueta correspondiente. Sin embargo, como sabemos que los datos de questions son todos sobre R, queremos etiquetarlas manualmente como preguntas de R con replace_na.

Este ejercicio forma parte del curso

Uniones de datos con dplyr

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Join the questions and question_tags tables
questions %>%
  ___
Editar y ejecutar código