ComeçarComece de graça

Múltiplas variáveis por coluna

Como você é uma pessoa ocupada, não quer gastar muito tempo no Netflix, então decide fazer alguns cálculos sobre a duração de séries e filmes antes de escolher o que assistir. Você conseguiu um conjunto de dados chamado netflix_df, mas a coluna duration tem um problema. Ela contém strings com o valor e a unidade da duração ("min" ou "Season").

Você vai organizar esse conjunto de dados para que cada variável tenha sua própria coluna.

Como sempre será o caso neste curso, o pacote tidyr já foi carregado para você.

Este exercício faz parte do curso

Reestruturando dados com tidyr

Ver curso

Instruções do exercício

  • Inspecione netflix_df digitando seu nome diretamente no console do R e pressionando Enter para ver qual string separa o valor da unidade na coluna duration.
  • Separe a coluna duration em duas variáveis chamadas value e unit. Passe a string que separa o número da unidade para o argumento sep.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

netflix_df %>% 
  # Split the duration column into value and unit columns
  separate(___, into = ___, sep = ___, convert = TRUE)
Editar e executar o código