1. 学ぶ
  2. /
  3. コース
  4. /
  5. HRアナリティクス:Pythonで従業員離職を予測する

Connected

演習

クラスの不均衡を解消する

recall と accuracy のスコア差からも分かるように、クラスの不均衡は予測結果に大きく影響します。これを解決する一般的な方法は、各クラスに同じ重みを与えることです。sklearn の DecisionTreeClassifier では、class_weight 引数を使ってクラスを "balanced" にできます。

それでは、不均衡の問題を解消してモデルを改善しましょう。

  • まず、クラス重みをバランスさせたモデルを設定します
  • 次に、学習データにフィットさせます
  • 最後に、テストデータで精度を確認します

features_train、target_train、features_test、target_test はすでにワークスペースに用意されています。

指示

100 XP
  • 決定木分類器を初期化し、最大深さを 5 に制限して木を枝刈りし、クラス重みをバランスさせます。
  • 新しいモデルをフィットします。
  • テストデータに対する予測の精度 score を(パーセンテージで)表示します。