1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで欠損データに対処する

Connected

演習

調整済みR二乗の比較と最良モデルの選択

欠損値を補完したDataFrameを線形モデルで分析する際には、最も当てはまりの良いモデルを示す指標として調整済みR二乗($adj.R^2$)を用います。

この演習では、前のステップでそれぞれの補完データセットに対して作成した 線形モデル(lm_mean、lm_KNN、lm_MICE)の \(adj.R^2\) を比較します。

まず、それぞれのモデルの属性 rsquared_adj を集めて(DataFrameを作成して)きれいに表示し、最後に \(adj.R^2\) が最大となるモデルを選びます。

これらのモデルはすでに lm_mean、lm_KNN、lm_MICE として読み込まれています。

指示1 / 2

undefined XP
  • 1
    • 各モデル(lm_mean、lm_KNN、lm_MICE)に対して .rsquared_adj 属性を使い、rsquared_df を作成します。
  • 2
    • max() 関数を使って、rsquared_df から最良のR二乗を取得します。key=rsquared_df.get により、それぞれのスコアが取得されます。