1. 学ぶ
  2. /
  3. コース
  4. /
  5. XGBoost で学ぶ極限の勾配ブースティング

Connected

演習

腎疾患ケーススタディ III: フルパイプライン

いよいよ、すべての変換と XGBClassifier を組み合わせて、フルパイプラインを作成します!

前の演習で作成した numeric_categorical_union に加えて、必要な変換が 2 つあります。こちらで用意した Dictifier() 変換と、DictVectorizer() です。

パイプラインを作成したら、どれくらい性能が出るかを確認するために交差検証を行ってください。

指示

100 XP
  • numeric_categorical_union、Dictifier()、DictVectorizer(sort=False) の各変換と、max_depth=3 を指定した推定器 xgb.XGBClassifier() を使ってパイプラインを作成します。各変換の名前は "featureunion"、"dictifier"、"vectorizer"、推定器は "clf" としてください。
  • cross_val_score() を使って pipeline に対して 3 分割の交差検証を実行します。引数にはパイプライン pipeline、特徴量 kidney_data、目的変数 y を渡し、scoring は "roc_auc"、cv は 3 に設定します。