1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで欠損データに対処する

Connected

演習

最頻値と定数による補完

平均、中央値、定数、最頻値で欠損値を埋める方法は、欠損が比較的少ない場合にとても有効です。前の演習では、平均と中央値での補完を行いました。この演習では、列内で最も頻度の高い値で埋める補完と、定数で埋める別の補完を行います。

これまでと同様に、diabetes のDataFrameと関数 SimpleImputer() は読み込まれています。

指示1 / 2

undefined XP
  • 1
    • 最頻値(most frequent)補完を行うために SimpleImputer() オブジェクトを作成します。
    • 複製したDataFrameに対して補完を実行します。
  • 2
    • 欠損値を 0 で埋めるように SimpleImputer() オブジェクトを作成します。
    • 複製したDataFrameに対して補完を実行します。