1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. HRアナリティクス:Pythonで従業員離職を予測する

Connected

Exercises

最良のモデルを開発して評価する

第3章で、以下のパラメータを使うとモデル性能が向上することがわかりました。

  • max_depth = 8,
  • min_samples_leaf = 150,
  • class_weight = "balanced"

この章では、いくつかの特徴量は影響が小さいことがわかりました。限られた重要な特徴量だけでも高い精度で予測できると判断し、それに合わせて学習用・テスト用データを更新し、features_train_selected と features_test_selected の変数を作成しました。

これらの情報を踏まえて、従業員の離職を予測するための最良のモデルを作成し、適切な指標で評価しましょう。

features_train_selected と features_test_selected はワークスペースに用意されています。また、recall_score と roc_auc_score 関数はインポート済みです。

คำแนะนำ

100 XP
  • 説明で指定されたパラメータを使って最良のモデルを初期化します。
  • 学習データの選択済み特徴量のみを使ってモデルを学習します。
  • テストデータの選択済み特徴量に基づいて予測します。
  • モデルの正解率、再現率、ROC/AUC スコアを出力します。