1. 学ぶ
  2. /
  3. コース
  4. /
  5. 統計的思考 ケーススタディ

Connected

演習

EDA:すべてのデータをプロットする

データセットを視覚的に把握するには、すべてのデータをプロットすることが効果的です。この演習では、800メートル予選に出場した女性スイマー全員のスプリットタイムをプロットしましょう。データは NumPy 配列 split_number と splits に格納されています。配列の構造として、splits[i,j] はスイマー i のスプリット番号 split_number[j] に対応するスプリットタイムを表しています。

指示

100 XP
  • for ループを使って各スイマーのスプリットセットを繰り返し処理し、以下を行いましょう。
    • スプリット番号に対するスプリットタイムをプロットします。キーワード引数 linewidth=1 および color='lightgray' を使用してください。
  • 各距離の平均スプリットタイムを計算します。np.mean() 関数に axis=0 キーワード引数を指定することで実現できます。これにより np.mean() が行方向に平均を計算し、各スプリット番号の平均スプリットタイムが得られます。
  • キーワード引数 marker='.'、linewidth=3、markersize=12 を使って、スプリット番号(x軸)に対する平均スプリットタイム(y軸)をプロットします。
  • 軸にラベルを付けてプロットを表示します。