1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Python으로 데이터 정제하기

Connected

Bài tập

범주 재매핑

airlines의 설문 응답자를 더 잘 이해하려면, 특정 응답이 요일과 게이트 대기 시간과 어떤 관계가 있는지 확인하고자 합니다.

airlines DataFrame에는 각각 범주형과 수치형인 day와 wait_min 열이 있습니다. day에는 항공편이 이루어진 정확한 요일이, wait_min에는 승객이 게이트에서 대기한 시간(분)이 들어 있습니다. 분석을 더 쉽게 하기 위해 다음 두 개의 새로운 범주형 변수를 만들려고 합니다.

  • wait_type: 0–60분은 'short', 60–180분은 'medium', 180분 이상은 long
  • day_week: 평일이면 'weekday', 주말이면 'weekend'

pandas와 numpy 패키지는 각각 pd와 np로 임포트되어 있습니다. 이제 새로운 범주형 데이터를 만들어 볼까요!

Hướng dẫn

100 XP
  • 설명에 나온 대로 wait_type 열에 사용할 구간과 레이블을 만드세요.
  • pd.cut()을 사용해 wait_min에서 wait_type 열을 생성하고, label_ranges와 label_names를 올바른 인자에 전달하세요.
  • 평일은 'weekday', 주말은 'weekend'로 매핑하는 mapping 딕셔너리를 만드세요.
  • .replace()를 사용해 day_week 열을 만드세요.