Memvisualisasikan banyak kategori
Sejauh ini dalam bab ini, kita hanya mempertimbangkan perbedaan pada variabel numerik antara dua kategori. Tentu saja, banyak himpunan data memiliki lebih dari dua kategori. Sebelum Anda melakukan pengujian pada banyak kategori, sering kali bermanfaat untuk melakukan exploratory data analysis (EDA), menghitung statistik ringkasan untuk setiap grup dan memvisualisasikan sebaran variabel numerik untuk tiap kategori menggunakan box plot.
Di sini, kita kembali ke data keterlambatan pengiriman, dan bagaimana harga setiap paket (pack_price) bervariasi di antara tiga moda pengiriman (shipment_mode): "Air", "Air Charter", dan "Ocean".
late_shipments tersedia; pandas dan matplotlib.pyplot telah dimuat dengan alias standarnya, dan seaborn dimuat sebagai sns.
Latihan ini merupakan bagian dari kursus
Pengujian Hipotesis dengan Python
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Calculate the mean pack_price for each shipment_mode
xbar_pack_by_mode = ____
# Print the grouped means
print(xbar_pack_by_mode)