1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで欠損データに対処する

Connected

演習

MICE による欠損値補完

fancyimpute パッケージには、欠損値を補完するための堅牢な Machine Learning モデルが多数用意されています。インピューターの完全な一覧は、詳細なドキュメントで確認できます。ここでは、欠損値補完に広く用いられる IterativeImputer(一般に MICE と呼ばれます)を使用します。

IterativeImputer は、データからランダムにサンプルを取り、複数の回帰を実行して結果を集約することで、欠損値を推定します。今回は、この補完を行うために diabetes データフレームを使用します。

指示

100 XP
  • fancyimpute から IterativeImputer をインポートします。
  • diabetes を diabetes_mice_imputed にコピーします。
  • IterativeImputer() オブジェクトを作成し、mice_imputer に代入します。
  • diabetes_mice_imputed データフレームの欠損値を補完します。