1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ仮説検定

Connected

演習

Wilcoxon-Mann-Whitney

ノンパラメトリックな仮説検定の一種に、ランク和検定(rank sum tests)があります。ランクとは、数値を小さい順に並べたときの位置のことです。陸上競技の順位のように考えてみましょう。最も速い(最も小さい)タイムがランク1、次に速いタイムがランク2、といった具合です。

実際の値ではなくデータのランクに基づいて計算することで、検定統計量の分布に関する仮定を置かずに済みます。これは、平均よりも中央値のほうが外れ値に強いのと同じように、よりロバストです。

よく使われるランクベースの検定の1つが Wilcoxon-Mann-Whitney 検定で、ノンパラメトリック版の t 検定のような位置づけです。

late_shipments が利用可能で、pingouin と、pandas は pd として読み込まれています。

指示

100 XP
  • late_shipments から weight_kilograms と late を選び、weight_vs_late という名前で代入します。
  • weight_vs_late をロング形式からワイド形式に変換し、columns を 'late' に設定します。
  • 送り状が遅延した場合と定時到着の場合で weight_kilograms に差があるか、Wilcoxon-Mann-Whitney 検定を実行します。