1. 学ぶ
  2. /
  3. コース
  4. /
  5. Testowanie hipotez w R

Connected

演習

Wizualizacja wielu kategorii

Do tej pory w tym rozdziale analizowaliśmy różnice w zmiennej numerycznej między dwiema kategoriami. Oczywiście wiele zbiorów danych zawiera więcej kategorii. Zanim przejdziesz do testowania wielu kategorii, warto przeprowadzić eksploracyjną analizę danych. Polega ona na obliczeniu statystyk podsumowujących dla każdej grupy i zwizualizowaniu rozkładów zmiennej numerycznej dla każdej kategorii za pomocą wykresów pudełkowych.

Wrócimy teraz do danych o opóźnionych dostawach i sprawdzimy, jak cena paczki (pack_price) różni się w zależności od trzech trybów wysyłki (shipment_mode): "Air", "Air Charter" i "Ocean".

Zbiór danych late_shipments jest dostępny; pakiety dplyr i ggplot2 są załadowane.

指示1 / 2

undefined XP
    1
    2
  • Korzystając ze zbioru danych late_shipments, pogrupuj dane według shipment_mode.
  • Użyj podsumowania, aby obliczyć średnią pack_price jako xbar_pack_price i odchylenie standardowe pack_price jako s_pack_price.