1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ線形モデリング入門

Connected

演習

`statsmodels` を使った最小二乗法

最適化の細かな処理を毎回自分で書かなくてもよいように、複数の Python ライブラリは便利な高水準インターフェースを提供しています。

この演習では例として、statsmodels ライブラリを使い、最小二乗法(RSS の最小化)によるモデル構築を、より高レベルで汎用的なワークフローで行います。

開始しやすいように、x_data, y_data = load_data() で読み込んだデータを、df = pd.DataFrame(dict(x_column=x_data, y_column=y_data)) を用いて、列名を x_column と y_column にして pandas の DataFrame に保存してあります。

指示

100 XP
  • formula="y_column ~ x_column"、data=df を指定して ols() でモデルを作成し、.fit() で当てはめてください。
  • model_fit.predict() を使って y_model を取得します。
  • 用意された関数 plot_data_with_model() を使い、y_data に y_model を重ねてプロットします。
  • model_fit.params からモデルパラメータ a0 と a1 を取り出します。
  • compute_rss_and_plot_fit() を使い、これらの結果が、numpy で実装した解析的な式と整合していることを確認してください。