1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ線形モデリング入門

Connected

演習

外挿:限界を越えるとき

この演習では、外挿の危険性を考えます。ここには、山のハイキングコースの標高プロファイルが示されています。黒で示した一部の区間は直線的に見え、モデルの構築に使われました。しかし、赤の最小二乗直線は、青で示した新しい外側のデータにまで拡張すると、元の「定義域」を外れるため当てはまりが悪くなることが分かります。

このモデルで標高を予測したいとき、ある許容誤差内で正確さを保つには、独立変数 x の最小値と最大値はどこまで許せるでしょうか?

ここでは、あらかじめ読み込まれている x_data、y_data、y_model、そして plot_data_model_tolerance() を使って解いてください。

指示

100 XP
  • np.abs() を使って、残差を y_data - y_model の差として計算します。
  • residuals が tolerance = 100 メートル未満となる x の .min() と .max() を求めます。
  • np.min() と np.max() を使って、x_good の最小値と最大値(範囲)を出力します。
  • 事前定義の plot_data_model_tolerance() を使い、residuals < tolerance が True となる x_good の範囲で、データ・モデル・範囲を比較して可視化します。