1. Learn
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶ仮説検定

Connected

Exercise

多数のカテゴリを可視化する

この章ではこれまで、数値変数の差を2つのカテゴリ間で比較する場合のみを扱ってきました。もちろん、多くのデータセットにはさらに多くのカテゴリが含まれます。複数カテゴリで検定を行う前に、各グループの要約統計量を計算し、箱ひげ図で各カテゴリの数値変数の分布を可視化するなど、探索的データ分析(EDA)を行うと役立ちます。

ここでは、遅延出荷データに戻り、各パッケージの価格(pack_price)が3つの出荷モード(shipment_mode)「"Air"」「"Air Charter"」「"Ocean"」の間でどのように異なるかを見ていきます。

late_shipments が利用可能です。pandas と matplotlib.pyplot は標準のエイリアスで読み込まれており、seaborn は sns として読み込まれています。

Instructions 1/3

undefined XP
    1
    2
    3
  • late_shipments を shipment_mode でグループ化し、各グループの pack_price の平均を計算して、結果を xbar_pack_by_mode に保存します。