IniziaInizia gratis

Left join tra domande e tag

Tre dei dataset del sondaggio di Stack Overflow sono questions, question_tags e tags:

  • questions: un ID e lo score, cioè quante volte la domanda è stata votata positivamente; i dati includono solo domande su R
  • question_tags: un ID di tag per ciascuna domanda e l'id della domanda
  • tags: un id di tag e il nome del tag, che può essere usato per identificare l’argomento di ogni domanda, come ggplot2 o dplyr

In questo esercizio metteremo insieme questi dataset e sostituiremo gli NA nei campi importanti.

Nota che useremo dei left_join in questo esercizio per assicurarci di mantenere tutte le domande, anche quelle senza un tag corrispondente. Tuttavia, dato che sappiamo che i dati di questions riguardano tutti R, vogliamo etichettarle manualmente come domande su R con replace_na.

Questo esercizio fa parte del corso

Unire i dati con dplyr

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Join the questions and question_tags tables
questions %>%
  ___
Modifica ed esegui il codice