1. Learn
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶクレジットリスクモデリング

Connected

Exercise

学習用データとテストデータの作成

あなたは先ほど、異なる列を使って LogisticRegression() モデルを学習しました。

データは学習用とテスト用に分割する必要があることを知っています。test_train_split() を使うと、両方を同時に作成できます。学習用データはモデルの学習に、テストデータは評価に使います。モデルを評価しなければ、新しいローンデータに対してどの程度うまく機能するのか判断できません。

モデルの属性である intercept_ に加えて、LogisticRegression() モデルには .coef_ 属性もあります。これは、延滞確率の予測において、各学習用の列がどれだけ重要かを示します。

データセット cr_loan_clean はすでにワークスペースに読み込まれています。

Instructions

100 XP
  • 金利、勤続年数、収入を使ってデータセット X を作成します。y はローンのステータスを使って作成します。
  • train_test_split() を使って、X と y から学習用とテスト用のセットを作成します。
  • LogisticRegression() モデルを作成して学習させ、clf_logistic として保存します。
  • .coef_ を使ってモデルの係数を出力します。