1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで欠損データに対処する

Connected

演習

平均値 & 中央値での代入

欠損値の代入は、大量のデータを扱うときに特に有効な方法です。最もシンプルな代入方法としては、定数で埋める、変数の平均値で埋める、あるいは中央値や最頻値といった基本的な統計量で埋めることが挙げられます。

この演習では、各列の欠損値を平均値と中央値で代入します。DataFrame diabetes はすでに読み込まれています。sklearn.impute の SimpleImputer() も使用できるようにインポート済みです。

指示1 / 2

undefined XP
  • 1
    • 平均値代入を行うための SimpleImputer() オブジェクトを作成します。
    • 複製した DataFrame に代入を適用します。
  • 2
    • 中央値代入を行うための SimpleImputer() オブジェクトを作成します。
    • 複製した DataFrame に代入を適用します。