1. Lära sig
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 가설 검정

Connected

exercise

다수 범주 시각화하기

이 장에서는 지금까지 두 범주 간의 수치형 변수 차이만 살펴봤습니다. 하지만 실제 데이터셋에는 더 많은 범주가 있는 경우가 많습니다. 여러 범주에 대한 검정을 수행하기 전에, 각 그룹에 대한 요약 통계치를 계산하고, 범주별 수치형 변수의 분포를 상자 그림으로 시각화하는 등 탐색적 데이터 분석(EDA)을 해두면 큰 도움이 됩니다.

여기서는 지연 배송 데이터로 돌아가서, 세 가지 배송 방식(shipment_mode)—"Air", "Air Charter", "Ocean"—에 따라 각 패키지 가격(pack_price)이 어떻게 달라지는지 살펴보겠습니다.

late_shipments가 제공되며, pandas와 matplotlib.pyplot은 표준 별칭으로, seaborn은 sns로 로드되어 있습니다.

Instruktioner 1 / 3

undefined XP
    1
    2
    3
  • late_shipments를 shipment_mode로 그룹화하고 각 그룹의 평균 pack_price를 계산해 xbar_pack_by_mode에 저장하세요.