1. 학습
  2. /
  3. 강의
  4. /
  5. R로 하는 가설 검정

Connected

연습 문제

여러 범주 시각화하기

이 장에서는 지금까지 두 범주 간의 수치형 변수 차이만 살펴봤어요. 물론 많은 데이터셋에는 더 많은 범주가 있습니다. 여러 범주에 대한 검정을 수행하기 전에, 탐색적 데이터 분석을 해 두면 도움이 됩니다. 즉, 각 그룹에 대한 요약 통계를 계산하고, 상자 그림을 사용해 각 범주에서 수치형 변수의 분포를 시각화하는 것이죠.

여기서는 다시 지연 배송 데이터로 돌아가서, 각 패키지의 가격(pack_price)이 세 가지 배송 방식(shipment_mode) — "Air", "Air Charter", "Ocean" — 사이에서 어떻게 달라지는지 살펴보겠습니다.

late_shipments를 사용할 수 있으며, dplyr과 ggplot2는 로드되어 있습니다.

지침 1/2

undefined XP
    1
    2
  • late_shipments 데이터셋을 사용해 shipment_mode로 그룹화하세요.
  • pack_price의 평균을 xbar_pack_price, 표준편차를 s_pack_price로 계산해 요약하세요.