ComeçarComece de graça

Fatorizar, segunda rodada

No exercício anterior, você aprendeu a importar um arquivo de dados usando o comando read_sav(). Com arquivos de dados do SPSS, pode acontecer de algumas variáveis importadas terem a classe labelled. Isso é feito para manter todas as informações de rotulagem originalmente presentes nos arquivos .sav e .por. É recomendável coerção (ou mudança) dessas variáveis para fatores ou outras classes padrão do R.

Os dados deste exercício envolvem informações sobre funcionários e seus atributos demográficos e econômicos (Fonte: QRiE). Os dados podem ser encontrados na seguinte URL:

https://assets.datacamp.com/production/course_1478/datasets/employee.sav

Este exercício faz parte do curso

Importação de dados intermediária em R

Ver curso

Instruções do exercício

  • Importe os dados do SPSS diretamente da URL e armazene o data frame resultante como work.
  • Mostre o resumo da coluna GENDER de work. Essa informação não parece muito útil, certo?
  • Converta a coluna GENDER em work para um fator, a classe usada para variáveis categóricas no R. Use as_factor().
  • Exiba novamente o resumo da coluna GENDER. Desta vez, a saída faz muito mais sentido.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# haven is already loaded

# Import SPSS data from the URL: work


# Display summary of work$GENDER


# Convert work$GENDER to a factor


# Display summary of work$GENDER again
Editar e executar o código