IniziaInizia gratis

Più variabili per colonna

Sei sempre di corsa e non vuoi passare troppo tempo su Netflix, quindi decidi di fare due conti sulla durata di serie TV e film prima di scegliere cosa guardare. Hai recuperato un insieme di dati chiamato netflix_df, ma la sua colonna duration ha un problema: contiene stringhe con sia il valore sia l'unità di durata ("min" o "Season").

Renderai questo insieme di dati ordinato in modo che ogni variabile abbia la propria colonna.

Come sempre in questo corso, il pacchetto tidyr è già stato caricato per te.

Questo esercizio fa parte del corso

Rimodellare i dati con tidyr

Visualizza il corso

Istruzioni dell'esercizio

  • Ispeziona netflix_df digitandone il nome direttamente nella console di R e premendo Invio per vedere quale stringa separa il valore dall'unità nella colonna duration.
  • Separa la colonna duration in due variabili chiamate value e unit. Passa al parametro sep la stringa che separa il numero dall'unità.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

netflix_df %>% 
  # Split the duration column into value and unit columns
  separate(___, into = ___, sep = ___, convert = TRUE)
Modifica ed esegui il codice