1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Kiểm định giả thuyết trong Python

Connected

Bài tập

Trực quan hóa nhiều hạng mục

Cho đến giờ trong chương này, bạn mới chỉ xét trường hợp sự khác biệt của một biến số giữa hai hạng mục. Dĩ nhiên, nhiều bộ dữ liệu có nhiều hạng mục hơn. Trước khi tiến hành kiểm định với nhiều hạng mục, thường hữu ích khi bạn làm phân tích khám phá dữ liệu (EDA): tính các thống kê tóm tắt cho từng nhóm và trực quan hóa phân phối của biến số theo từng hạng mục bằng biểu đồ hộp (box plot).

Ở đây, chúng ta quay lại dữ liệu giao hàng trễ và xem giá của mỗi kiện hàng (pack_price) thay đổi như thế nào giữa ba phương thức vận chuyển (shipment_mode): "Air", "Air Charter", và "Ocean".

late_shipments đã có sẵn; pandas và matplotlib.pyplot đã được nạp với các bí danh chuẩn, và seaborn được nạp là sns.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Nhóm late_shipments theo shipment_mode và tính giá trị trung bình pack_price cho từng nhóm, lưu kết quả vào xbar_pack_by_mode.