ランダムフォレスト

Random Forest は、ブートストラップ集約（略して bagging）により個々の決定木を活用する、古典的かつ強力なアンサンブル手法です。このモデルで主に調整するハイパーパラメータは、木の本数と各木の最大深さの2つです。この演習では、いくつかの固定したハイパーパラメータ値で、シンプルなランダムフォレスト分類器を実装して評価します。

X_train、y_train、X_test、y_test はワークスペースに用意されています。pandas は pd、numpy は np として、sklearn も利用可能です。sklearn.ensemble の RandomForestClassifier() に加えて、sklearn.metrics の roc_curve() と auc() も使用できます。