Memvisualisasikan banyak kategori
Sejauh ini dalam bab ini, kita baru meninjau perbedaan suatu variabel numerik antara dua kategori. Tentu saja, banyak himpunan data memiliki lebih dari dua kategori. Sebelum Anda melakukan pengujian pada banyak kategori, sering kali bermanfaat melakukan analisis data eksploratori. Caranya, hitung statistik ringkas untuk setiap kelompok dan visualisasikan sebaran variabel numerik untuk tiap kategori menggunakan box plot.
Di sini, kita kembali ke data keterlambatan pengiriman, dan melihat bagaimana harga setiap paket (pack_price) berbeda di antara tiga moda pengiriman (shipment_mode): "Air", "Air Charter", dan "Ocean".
late_shipments tersedia; dplyr dan ggplot2 sudah dimuat.
Latihan ini adalah bagian dari kursus
Pengujian Hipotesis di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Using late_shipments, group by shipment mode, and calculate the mean and std dev of pack price
___