1. Lära sig
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶクレジットリスクモデリング

Connected

exercise

クレジットデータのワンホットエンコード

LogisticRegression() モデルに追加できるよう、非数値列を準備しましょう。

ワンホットエンコードで新しい列を作成したら、数値列と連結して、新しいデータフレームを作ります。これは以降のレッスンで、デフォルト確率の予測に使用します。

ワンホットエンコードは非数値列のみに適用してください。数値列に対して行うと、データが極端に横に広がってしまいます!

クレジットローンデータ cr_loan_clean はワークスペースに読み込まれています。

Instruktioner

100 XP
  • 数値列すべてのデータセットを cred_num、非数値列のデータセットを cred_str として作成します。
  • cred_str にワンホットエンコードを適用し、cred_str_onehot という新しいデータセットを作成します。
  • cred_num と新しいワンホットエンコード済みデータを結合し、結果を cr_loan_prep に保存します。
  • 新しいデータセットの列名を出力します。