Fatorizar, segunda rodada
No exercício anterior, você aprendeu a importar um arquivo de dados usando o comando read_sav(). Com arquivos de dados do SPSS, pode acontecer de algumas variáveis importadas terem a classe labelled. Isso é feito para manter todas as informações de rotulagem originalmente presentes nos arquivos .sav e .por. É recomendável coerção (ou mudança) dessas variáveis para fatores ou outras classes padrão do R.
Os dados deste exercício envolvem informações sobre funcionários e seus atributos demográficos e econômicos (Fonte: QRiE). Os dados podem ser encontrados na seguinte URL:
https://assets.datacamp.com/production/course_1478/datasets/employee.sav
Este exercício faz parte do curso
Importação de dados intermediária em R
Instruções do exercício
- Importe os dados do SPSS diretamente da URL e armazene o data frame resultante como
work. - Mostre o resumo da coluna
GENDERdework. Essa informação não parece muito útil, certo? - Converta a coluna
GENDERemworkpara um fator, a classe usada para variáveis categóricas no R. Useas_factor(). - Exiba novamente o resumo da coluna
GENDER. Desta vez, a saída faz muito mais sentido.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# haven is already loaded
# Import SPSS data from the URL: work
# Display summary of work$GENDER
# Convert work$GENDER to a factor
# Display summary of work$GENDER again