1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで欠損データに対処する

Connected

演習

線形モデルのサマリーを分析する

欠損値を扱ううえで、異なる補完モデルの性能を分析することは最も重要な作業の一つです。どの種類の補完後DataFrameを信頼できるかを見極めるためです。分析では、補完後のDataFrameに線形回帰モデルを当てはめ、補完方法の選択に影響するさまざまな指標を確認します。

この演習では、糖尿病データの完全事例である DataFrame diabetes_cc がすでに読み込まれています。完全事例は、他の補完後DataFrameとの比較の基準として機能します。線形回帰モデルの作成とサマリーの生成には、statsmodels.api(sm として読み込み)を使用します。

指示1 / 4

undefined XP
    1
    2
    3
    4
  • DataFrame diabetes_cc の全特徴量に定数項を追加して X に設定し、'Class' 列は除外して y に設定します。