1. 학습
  2. /
  3. 강의
  4. /
  5. R 입문

Connected

연습 문제

팩터 레벨

데이터셋을 처음 받으면, 특정 레벨을 가진 팩터가 포함되어 있는 경우가 많습니다. 하지만 더 명확하게 하거나 다른 이유로 이 레벨의 이름을 바꾸고 싶을 때가 있죠. R에서는 levels() 함수를 사용해 이를 변경할 수 있어요:

levels(factor_vector) <- c("name1", "name2",...)

좋은 예로 설문조사에서 제공되는 원시 데이터를 들 수 있습니다. 대부분의 설문에는 응답자의 성별을 묻는 질문이 포함되는데요, 여기서는 단순화를 위해 "M"과 "F" 두 가지 범주만 기록되었다고 가정하겠습니다. (실제 설문 데이터에서는 더 많은 범주가 필요할 수 있지만, 어쨌든 범주형 데이터는 팩터로 저장합니다.)

survey_vector <- c("M", "F", "F", "M", "M")

성별을 "M"과 "F" 같은 약어로 기록하면 펜과 종이로 데이터를 수집할 때는 편리하지만, 데이터를 분석할 때 혼란을 줄 수 있습니다. 분석 단계에서는 보통 명확성을 위해 "M"과 "F" 대신 "Male"과 "Female"로 팩터 레벨을 바꾸고 싶어질 거예요.

주의: 레벨을 할당하는 순서는 매우 중요합니다. levels(factor_survey_vector)를 입력하면 출력이 [1] "F" "M"임을 볼 수 있어요. 벡터를 만들 때 팩터의 레벨을 지정하지 않으면 R은 알파벳 순으로 자동 할당합니다. "F"를 "Female"에, "M"을 "Male"에 올바르게 매핑하려면 레벨을 이 순서로 c("Female", "Male")로 설정해야 합니다.

지침

100 XP
  • survey_vector에서 팩터 벡터를 만드는 코드를 확인하세요. 다음 지침에서는 factor_survey_vector를 사용합니다.
  • factor_survey_vector의 팩터 레벨을 c("Female", "Male")로 변경하세요. 여기서 벡터 요소의 순서에 유의하세요.