Più variabili per colonna
Sei sempre di corsa e non vuoi passare troppo tempo su Netflix, quindi decidi di fare due conti sulla durata di serie TV e film prima di scegliere cosa guardare.
Hai recuperato un insieme di dati chiamato netflix_df, ma la sua colonna duration ha un problema: contiene stringhe con sia il valore sia l'unità di durata ("min" o "Season").
Renderai questo insieme di dati ordinato in modo che ogni variabile abbia la propria colonna.
Come sempre in questo corso, il pacchetto tidyr è già stato caricato per te.
Questo esercizio fa parte del corso
Rimodellare i dati con tidyr
Istruzioni dell'esercizio
- Ispeziona
netflix_dfdigitandone il nome direttamente nella console di R e premendo Invio per vedere quale stringa separa il valore dall'unità nella colonnaduration. - Separa la colonna
durationin due variabili chiamatevalueeunit. Passa al parametrosepla stringa che separa il numero dall'unità.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
netflix_df %>%
# Split the duration column into value and unit columns
separate(___, into = ___, sep = ___, convert = TRUE)