Níveis de fatores (Factor levels)
Quando você começa um conjunto de dados, você Frequentemente notar que ele contém fatores com específicos níveis. Contudo, algumas vezes você precisará mudar os nomes desses níveis para esclarecimento ou outras razões. R permite você fazer isso com a função levels()
:
levels(factor_vector) <- c("name1", "name2",...)
Um bom exemplo de ilustração são os dados brutos que são providos a você por um questionário. Uma pergunta padrão feita as pessoas que respondem a um questionário é o gênero que ele corresponde. Você deve se lembrar do exercício anterior que isso é um fator e, quando é realizado o questionamento nas ruas seus nívels geralmente são "M"
e "F"
.
survey_vector <- c("M", "F", "F", "M", "M")
Em seguida, quando você quer iniciar sua análise de dados, sua principal preocupação é ter um bom resumo de todas as variáveis e seus significados. Nesse ponto, você provavelmente mudará o nível dos fatores para "Male"
e "Female"
, ao invés de "M"
e "F"
, tudo isso para tornar sua vida mais fácil.
Watch out: A ordem que você usa para definir os níveis é importante! Se você digitar levels(factor_survey_vector)
, você verá que ele exibe [1] "F" "M"
. Se você não especifícar os níveis do fator quando criar o vetor, R
irá definir definí-lo por ordem alfabética, automaticamente. Para mapear corretamente "F"
para "Female"
e "M"
para "Male"
, os níveis devem ser definidos como c("Female", "Male")
, nesta mesma ordem.
This exercise is part of the course
Introdução a R
Exercise instructions
- Verifique o código que cria um fator em
survey_vector
. Você deve usarfactor_survey_vector
na próxima instrução. - Mude os níveis de fator em
factor_survey_vector
parac("Female", "Male")
. Lembre-se da ordem correta dos elementos do vetor.
Hands-on interactive exercise
Have a go at this exercise by completing this sample code.
# Código para criar factor_survey_vector
survey_vector <- c("M", "F", "F", "M", "M")
factor_survey_vector <- factor(survey_vector)
# Especifique os níveis em factor_survey_vector
levels(factor_survey_vector) <-
factor_survey_vector