1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 데이터 정제하기

Connected

연습 문제

일관성 없는 범주

이번 연습에서는 이전 레슨에서 사용했던 airlines DataFrame을 다시 살펴봅니다.

이 DataFrame에는 항공사, 목적지, 대기 시간, 그리고 샌프란시스코 공항의 청결도, 안전, 만족도에 관한 핵심 질문에 대한 답변 같은 비행 관련 메타데이터가 들어 있습니다.

이번에는 이 DataFrame에서 두 개의 범주형 열인 dest_region과 dest_size를 살펴보고, 어떤 방식으로 다뤄야 할지 평가한 뒤 분석에 사용할 수 있도록 깨끗하게 정리해 보겠습니다. pandas 패키지는 pd로 임포트되어 있으며, airlines DataFrame은 이미 작업 환경에 준비되어 있습니다.

지침 1/4

undefined XP
    1
    2
    3
    4
  • 각각 dest_region과 dest_size의 고유 값을 출력하세요.