1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ推測の基礎

Connected

演習

中央値を比較する

パラメトリック検定は平均を比較することが多く、ノンパラメトリック検定は中央値を比較することが多いです。これは、データが歪んでいる場合、平均は代表値として適切でない可能性があり、代わりに中央値を用いるべきだからです。

先ほど確認した各大学ランキング機関には、各大学の「総合スコア」も含まれています。まずヒストグラムを使って、これらのスコアがおおよそ正規分布かどうかを確認します。正規分布でなければ、中央値を比較するためにMoodの中央値検定を行います。この演習では、CWとARWの大学ランキングを扱います。

ヒストグラムの作り方はいくつかありますが、ここでは前と同様に.hist()メソッドを使って練習します。

3種類のランキングが含まれたDataFrameはrankings_dfにあります。pandasはpd、NumPyはnp、Matplotlib.pyplotはplt、そしてSciPyのstatsパッケージがすでに読み込まれています。

指示1 / 3

undefined XP
    1
    2
    3
  • cw_score列のヒストグラムを描画します。