Múltiplas variáveis por coluna
Como você é uma pessoa ocupada, não quer gastar muito tempo no Netflix, então decide fazer alguns cálculos sobre a duração de séries e filmes antes de escolher o que assistir.
Você conseguiu um conjunto de dados chamado netflix_df, mas a coluna duration tem um problema. Ela contém strings com o valor e a unidade da duração ("min" ou "Season").
Você vai organizar esse conjunto de dados para que cada variável tenha sua própria coluna.
Como sempre será o caso neste curso, o pacote tidyr já foi carregado para você.
Este exercício faz parte do curso
Reestruturando dados com tidyr
Instruções do exercício
- Inspecione
netflix_dfdigitando seu nome diretamente no console do R e pressionando Enter para ver qual string separa o valor da unidade na colunaduration. - Separe a coluna
durationem duas variáveis chamadasvalueeunit. Passe a string que separa o número da unidade para o argumentosep.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
netflix_df %>%
# Split the duration column into value and unit columns
separate(___, into = ___, sep = ___, convert = TRUE)