1. 学ぶ
  2. /
  3. コース
  4. /
  5. 統計的思考 ケーススタディ

Connected

演習

コースの影響はレーン位置によってどう変わるか?

レーン番号がパフォーマンスに与える影響を定量化するため、f_13 と lanes のデータに対して線形回帰を実行します。その後、ペアブートストラップ法で95%信頼区間を求め、最後に回帰直線をプロットします。配列 lanes と f_13 はすでに名前空間に用意されています。

なお、平均分数差の誤差バーを計算して回帰に組み込む方法もありますが、このコースの範囲外となるため省略します。

指示

100 XP
  • np.polyfit() を使って、f_13 と lanes の直線の傾きと切片を計算します。
  • dcst.draw_bs_pairs_linreg() を使って、傾きと切片のブートストラップ反復値を10,000個生成し、それぞれ bs_reps_slope と bs_reps_int に格納します。
  • ブートストラップ反復値を用いて、傾きの95%信頼区間を計算します。
  • 傾きと95%信頼区間を画面に出力します。この部分はすでに記述済みです。
  • np.array() を使って、ブートストラップ直線のプロット用x値を生成します。x は 1 から 8 の範囲にします。
  • プロットにはすでにデータが描画されています。for ループを記述し、キーワード引数 color='red'、alpha=0.2、linewidth=0.5 を使って、100本のブートストラップ直線をプロットに追加します。