1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Extreme Gradient Boosting with XGBoost

Connected

cvičení

Případová studie – onemocnění ledvin III: Kompletní pipeline

Je čas poskládat všechny transformace dohromady s klasifikátorem XGBClassifier a sestavit kompletní pipeline!

Kromě numeric_categorical_union, který jsi vytvořil/a v předchozím cvičení, jsou potřeba ještě dvě další transformace: Dictifier(), kterou jsme připravili za tebe, a DictVectorizer().

Po vytvoření pipeline ji pomocí křížové validace otestuj a zjisti, jak dobře funguje.

Pokyny

100 XP
  • Vytvoř pipeline pomocí transformací numeric_categorical_union, Dictifier() a DictVectorizer(sort=False) a estimátoru xgb.XGBClassifier() s parametrem max_depth=3. Transformace pojmenuj "featureunion", "dictifier", "vectorizer" a estimátor "clf".
  • Proveď 3-foldovou křížovou validaci pipeline pomocí cross_val_score(). Předej jí pipeline pipeline, příznaky kidney_data, cílové hodnoty y. Nastav také scoring na "roc_auc" a cv na 3.