1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. XGBoost で学ぶ極限の勾配ブースティング

Connected

Exercises

正解率を測る

ここでは、XGBoost に組み込まれている交差検証機能を使って、XGBoost の学習 API を実践します。前の動画で Sergey も説明したとおり、XGBoost は DMatrix と呼ばれるデータセット用の最適化された独自データ構造を用いることで、高速かつ高性能な学習を実現しています。

前の演習では、入力データセットはその場で DMatrix に変換されていましたが、xgboost の cv オブジェクトを使う場合は、先に明示的にデータを DMatrix に変換する必要があります。そこで今回は、churn_data に対して交差検証を実行する前に、その手順を行います。

คำแนะนำ

100 XP
  • xgb.DMatrix() を使って、churn_data から churn_dmatrix という DMatrix を作成します。特徴量は X、ラベルは y に用意されています。
  • xgb.cv() を呼び出して 3 分割の交差検証を実行します。dtrain は作成した churn_dmatrix、params はパラメータ辞書、nfold は交差検証の分割数(3)、num_boost_round は作成したい木の数(5)、metrics は計算したい指標(ここでは "error"。これを正解率に変換します)です。