1. 학습
  2. /
  3. 강의
  4. /
  5. R 사용자용 Python

Connected

연습 문제

범주형(Category)

Pandas에는 R의 factor와 유사한 category 데이터 타입이 있습니다.

열을 범주형 데이터 타입으로 변환하려면 .astype() 메서드에 'category'를 전달하면 됩니다. 범주형 열로 변환한 뒤에는 .cat 접근자를 사용해 .categories 속성을 호출하면 다양한 범주(R에서는 levels라고 부릅니다)를 확인할 수 있어요.

범주형 값을 사용하는 또 다른 이유는 데이터의 순서를 보존하고 싶을 때입니다. 예를 들어, 직관적으로는 'low'가 'high'보다 먼저 오는 것이 자연스럽죠. 이때 reorder_categories()를 사용해 열의 순서를 지정할 수 있습니다.

# 범주(level) 순서 재지정
df['column_name'].cat.reorder_categories(['low', 'high'], ordered=True)

지침 1/2

undefined XP
    1
    2

'time' 열의 타입을 category로 변환하고, 이 열의 범주를 출력하세요.