1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Pythonで学ぶクレジットリスクモデリング

Connected

Bài tập

クロステーブルで外れ値を見つける

次は、データ内にあるかもしれない外れ値を見つけて除去します。今回の演習では、クロステーブルと集約関数を使います。

person_emp_length 列を確認しましょう。これまで数値列の平均を見るために aggfunc = 'mean' 引数を使いましたが、外れ値を検出するには min や max といった別の関数も使えます。

雇用年数が 0 未満や 60 を超えることは現実的ではないかもしれません。クロステーブルを使ってデータを確認し、そのような事例がないか調べてみましょう。

データセット cr_loan はワークスペースに読み込まれています。

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • loan_status と person_home_ownership のクロステーブルを、person_emp_length の最大値で表示してください。