1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rによる仮説検定

Connected

演習

多くのカテゴリを可視化する

この章ではこれまで、数値変数が2つのカテゴリ間でどう異なるかだけを見てきました。もちろん、実際のデータセットにはより多くのカテゴリが含まれることがよくあります。多くのカテゴリで検定を行う前に、探索的データ分析を行うと役立つことが多いです。具体的には、各グループの要約統計量を計算し、ボックスプロットを使って各カテゴリの数値変数の分布を可視化します。

ここでは、遅延出荷データに戻り、各荷物の価格(pack_price)が3つの出荷モード(shipment_mode)— "Air"、"Air Charter"、"Ocean" — の間でどのように変わるかを見ていきます。

late_shipments は利用可能で、dplyr と ggplot2 は読み込まれています。

指示1 / 2

undefined XP
    1
    2
  • late_shipments データセットを使い、shipment_mode でグループ化します。
  • 要約して、pack_price の平均を xbar_pack_price、標準偏差を s_pack_price として計算します。