1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶクレジットリスクモデリング

Connected

演習

欠損したクレジットデータの置換

まず、欠損データを確認しましょう。loan_status に欠損がある場合、貸倒かどうかが分からないため、デフォルト確率の予測にそのデータは使えません。person_emp_length の欠損はそれほど致命的ではありませんが、学習時のエラーにつながります。

そこで、person_emp_length 列の欠損データを確認し、欠損値は中央値で置き換えてください。

データセット cr_loan はワークスペースに読み込まれています。

指示

100 XP
  • .isnull() を使って、欠損データを含む列名の配列を出力します。
  • person_emp_length に欠損があるデータの先頭5行を出力します。
  • .fillna() を使って、すべての雇用年数の中央値で欠損データを置き換えます。
  • 分布を確認するため、person_emp_length 列のヒストグラムを作成します。