1. Învăţa
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶMachine Learning面接対策

Connected

exercise

欠損値を見つけよう

欠損値への対処は、どんなMachine Learningの面接でも重要なテーマです。欠損を含むデータセットが与えられたのに何もしないと、結果が偏り、モデルの精度が下がってしまいます。

この演習では、顧客ローンのデータセットを使って、pandas と numpy で欠損値を見つけ、扱う方法を試します。これは前処理の最初のステップの練習です。

このコースの多くの演習で使うデータセットは、ワークスペースに loan_data として保存されています。

現在のパイプラインの位置は次のとおりです。

Machine learning pipeline

Instrucțiuni 1 / 4

undefined XP
  • 1
    • loan_data の各特徴量と、その欠損値の数を出力してください。
  • 2
    • 欠損値を含む行を削除し、残った行の割合を出力してください。
  • 3
    • 欠損値を含む列を削除し、残った列の割合を出力してください。
  • 4
    • loan_data の欠損値を 0 で補完して loan_data_filled に代入してください。
    • 補完前(loan_data)と補完後(loan_data_filled)で、.describe() を使って 'Credit Score' を比較してください。