MulaiMulai sekarang secara gratis

Memvisualisasikan banyak kategori

Sejauh ini dalam bab ini, kita hanya mempertimbangkan perbedaan pada variabel numerik antara dua kategori. Tentu saja, banyak himpunan data memiliki lebih dari dua kategori. Sebelum Anda melakukan pengujian pada banyak kategori, sering kali bermanfaat untuk melakukan exploratory data analysis (EDA), menghitung statistik ringkasan untuk setiap grup dan memvisualisasikan sebaran variabel numerik untuk tiap kategori menggunakan box plot.

Di sini, kita kembali ke data keterlambatan pengiriman, dan bagaimana harga setiap paket (pack_price) bervariasi di antara tiga moda pengiriman (shipment_mode): "Air", "Air Charter", dan "Ocean".

late_shipments tersedia; pandas dan matplotlib.pyplot telah dimuat dengan alias standarnya, dan seaborn dimuat sebagai sns.

Latihan ini adalah bagian dari kursus

Pengujian Hipotesis dengan Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Calculate the mean pack_price for each shipment_mode
xbar_pack_by_mode = ____

# Print the grouped means
print(xbar_pack_by_mode)
Edit dan Jalankan Kode