1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶクレジットリスクモデリング

Connected

演習

クレジットデータの外れ値を可視化する

person_emp_length では、60を超える値が明らかに基準から外れていることを見つけました。person_age も、ローン申請者が100歳を超える可能性は非常に低いと常識的に判断できる列です。

ここではデータを可視化することで、外れ値を簡単に検出できます。loan_amnt や loan_int_rate などの数値列を使い、person_age と組み合わせてプロットを作成し、外れ値を探してみましょう。

データセット cr_loan はワークスペースに読み込まれています。

指示1 / 2

undefined XP
    1
    2
  • x軸に年齢、y軸に loan_amnt を置いた散布図を作成します。