1. 学ぶ
  2. /
  3. コース
  4. /
  5. HRアナリティクス:Pythonで従業員離職を予測する

Connected

演習

木の剪定(Pruning)

過学習は分析における典型的な課題で、特に決定木アルゴリズムで起こりやすいです。木を最大まで成長させると、訓練サンプルでは非常に高い精度を示す一方で、テストセットでは同じように高精度にならないことがあります。そのため、決定木の成長は通常、次のように制御します。

  • 木を「剪定」して、最大深さに上限を設ける。
  • 各葉に含める最小観測数に制限を設ける。

この演習では、次を行います。

  • 木を剪定し、深さを5階層に制限する
  • 従業員データに学習させる
  • 訓練セットとテストセットの両方で予測結果を評価する

変数 features_train、target_train、features_test、target_test は、すでにワークスペースに用意されています。

指示

100 XP
  • 決定木の深さを 5 に制限して DecisionTreeClassifier を初期化します。
  • 訓練セットの features と target を使って決定木モデルを学習させます。
  • 訓練セットとテストセットの両方で予測の正解率を確認します。