1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ線形モデリング入門

Connected

演習

速度と信頼区間を推定する

国立公園のハイキングデータを引き続き見ていきましょう。出発点とは反対方向に歩いたため、距離が負になっているものもあります。データは少し雑なので、ここでは全体的な傾向に注目します。

この演習の目標は、ブートストラップ再標本化を使って線形モデルの速度値の分布を求め、その分布から速度の最良推定値と、その推定値の90%信頼区間を計算することです。ここでいう速度は、距離を時間の関数として当てはめた線形回帰モデルの傾きパラメータを指します。

準備として、distance と time のデータ、および各再標本に対して速度値を計算するための事前定義済み関数 least_squares() を読み込んであります。

指示

100 XP
  • np.random.choice() を使って、各データの距離-時間の対応関係を保ったまま、population_inds から sample_inds を抽出します。
  • 時間順序を保つために、sample_inds を .sort() し、その後 sample_inds を使って distances と times をインデックス指定します。
  • least_squares(times, distances) で線形モデルのパラメータを計算し、a1 を resample_speeds に保存します。
  • np.mean() と np.percentiles() を resample_speeds に適用して速度と信頼区間 ci_90 を計算し、両方を出力します。