Birden çok kategoriyi görselleştirme
Bu bölümde şimdiye kadar yalnızca sayısal bir değişkenin iki kategori arasındaki farklarını ele aldık. Elbette çoğu veri kümesinde daha fazla kategori bulunur. Birden çok kategori üzerinde testlere geçmeden önce, genellikle keşifsel veri analizi (EDA) yapmak faydalıdır: her grup için özet istatistikleri hesaplamak ve her kategori için sayısal değişkenin dağılımını kutu grafikleriyle görselleştirmek gibi.
Burada, gecikmiş gönderiler verisine geri döneceğiz ve her paketin fiyatının (pack_price), üç gönderim modu (shipment_mode): "Air", "Air Charter" ve "Ocean" arasında nasıl değiştiğine bakacağız.
late_shipments hazır; pandas ve matplotlib.pyplot standart kısaltmalarıyla yüklendi ve seaborn sns olarak yüklendi.
Bu egzersiz
Python'da Hipotez Testi
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Calculate the mean pack_price for each shipment_mode
xbar_pack_by_mode = ____
# Print the grouped means
print(xbar_pack_by_mode)