1. Învăţa
  2. /
  3. Courses
  4. /
  5. PythonでMachine Learningを使ってCTRを予測する

Connected

exercise

ランダムフォレスト

Random Forest は、ブートストラップ集約(略して bagging)により個々の決定木を活用する、古典的かつ強力なアンサンブル手法です。このモデルで主に調整するハイパーパラメータは、木の本数と各木の最大深さの2つです。この演習では、いくつかの固定したハイパーパラメータ値で、シンプルなランダムフォレスト分類器を実装して評価します。

X_train、y_train、X_test、y_test はワークスペースに用意されています。pandas は pd、numpy は np として、sklearn も利用可能です。sklearn.ensemble の RandomForestClassifier() に加えて、sklearn.metrics の roc_curve() と auc() も使用できます。

Instrucţiuni

100 XP
  • 木の本数を50、最大深さを5として、ランダムフォレスト分類器を作成します。
  • 分類器を学習させ、テストデータに対して .predict_proba() で確率スコア、.predict() で予測ラベルを取得します。
  • まず roc_curve() で fpr と tpr を計算し、その結果に auc() を適用して、この分類器の ROC 曲線の AUC を評価します。
  • この分類器の適合率(precision)と再現率(recall)を評価します。