1. 학습
  2. /
  3. 강의
  4. /
  5. R 입문

Connected

연습 문제

팩터 수준

데이터셋을 처음 받았을 때, 특정 팩터 수준을 가진 팩터가 포함되어 있는 경우가 많습니다. 그런데 때로는 명확성이나 다른 이유로 수준의 이름을 변경하고 싶을 수 있습니다. R에서는 levels() 함수를 사용하여 이를 할 수 있습니다:

levels(factor_vector) <- c("name1", "name2",...)

설문조사에서 제공되는 원시 데이터를 예로 들어 보겠습니다. 거의 모든 설문지에서 공통적으로 묻는 항목 중 하나가 응답자의 성별입니다. 여기서는 간단하게 "M"과 "F", 두 가지 범주만 기록했다고 가정합니다. (실제 설문 데이터에는 더 많은 범주가 필요한 경우도 있지만, 어느 경우든 팩터를 사용하여 범주형 데이터를 저장합니다.)

survey_vector <- c("M", "F", "F", "M", "M")

"M"과 "F"로 성별을 기록하는 방식은 종이에 데이터를 수집할 때는 편리하지만, 데이터를 분석할 때 혼란을 일으킬 수 있습니다. 이럴 때 명확성을 위해 팩터 수준을 "Male"과 "Female" 대신 "M"과 "F"로 변경하는 것이 좋습니다.

주의: 수준을 지정하는 순서가 중요합니다. levels(factor_survey_vector)를 입력하면 [1] "F" "M"이 출력되는 것을 확인할 수 있습니다. 벡터를 생성할 때 팩터 수준을 별도로 지정하지 않으면, R은 자동으로 알파벳 순서로 수준을 할당합니다. "F"를 "Female"에, "M"을 "Male"에 올바르게 매핑하려면, 수준을 c("Female", "Male") 순서로 설정해야 합니다.

지침

100 XP
  • survey_vector를 바탕으로 팩터 벡터를 만드는 코드를 확인하세요. 다음 지침에서 factor_survey_vector를 사용합니다.
  • factor_survey_vector의 팩터 수준을 c("Female", "Male")으로 변경하세요. 벡터 요소의 순서에 주의하세요.