1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶMachine Learning面接対策

Connected

演習

単純代入(Simple imputation)

前の演習で見たように、欠損値のある行を削除すると、データが大きく減ってしまうことがあります。面接の文脈では、これはMachine Learningモデルの結果にバイアスを生む可能性があります。

より柔軟な対処法として、欠損値を代入(imputation)する方法があります。Pythonではさまざまなやり方がありますが、この演習では sklearn.impute モジュールの SimpleImputer() を loan_data に対して使用します。

その後、pandas と numpy を使って、代入後のデータセットをDataFrameに変換します。

今回はパイプラインに2つのステップ、Instantiate と Fit が追加されています: Machine learning pipeline

指示1 / 4

undefined XP
    1
    2
    3
    4
  • loan_data の数値列だけを抽出して numeric_cols に代入してください。