1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶクレジットリスクモデリング

Connected

演習

欠損データの削除

前の演習で person_emp_length の欠損値を置換しましたが、loan_int_rate にも欠損があることがわかりました。

loan_status に欠損がある場合と同様に、loan_int_rate に欠損があると予測が難しくなります。

金利は自社で設定するため、この列に欠損があるのは非常に不自然です。データ取り込み時の不具合でエラーが生じた可能性はありますが、確証はありません。先に進む前に、ひとまずこれらのレコードは .drop() するのが最善です。

データセット cr_loan はワークスペースに読み込まれています。

指示

100 XP
  • 金利に欠損があるレコード数を出力してください。
  • 金利が欠損している行のインデックス配列を作成し、変数名を indices にしてください。
  • 金利が欠損しているレコードを削除し、結果を cr_loan_clean に保存してください。