木の剪定（Pruning）

過学習は分析における典型的な課題で、特に決定木アルゴリズムで起こりやすいです。木を最大まで成長させると、訓練サンプルでは非常に高い精度を示す一方で、テストセットでは同じように高精度にならないことがあります。そのため、決定木の成長は通常、次のように制御します。

木を「剪定」して、最大深さに上限を設ける。
各葉に含める最小観測数に制限を設ける。

この演習では、次を行います。

木を剪定し、深さを5階層に制限する
従業員データに学習させる
訓練セットとテストセットの両方で予測結果を評価する

変数 features_train、target_train、features_test、target_test は、すでにワークスペースに用意されています。

決定木の深さを 5 に制限して DecisionTreeClassifier を初期化します。
訓練セットの features と target を使って決定木モデルを学習させます。
訓練セットとテストセットの両方で予測の正解率を確認します。