Fallstudie Nierenerkrankungen III: Vollständige Pipeline
Jetzt ist es Zeit, alle Transforms zusammen mit einem XGBClassifier zu einer vollständigen Pipeline zusammenzufügen!
Neben der numeric_categorical_union, die du in der vorherigen Übung erstellt hast, werden zwei weitere Transforms benötigt: der Dictifier()-Transform, den wir für dich erstellt haben, und der DictVectorizer().
Nachdem du die Pipeline erstellt hast, sollst du sie per Cross-Validation evaluieren, um zu sehen, wie gut sie performt.
Diese Übung ist Teil des Kurses
Extreme Gradient Boosting mit XGBoost
Anleitung zur Übung
- Erstelle die Pipeline mit den Transforms
numeric_categorical_union,Dictifier()undDictVectorizer(sort=False)sowie dem Estimatorxgb.XGBClassifier()mitmax_depth=3. Benenne die Transforms"featureunion","dictifier","vectorizer"und den Estimator"clf". - Führe eine 3-fache Cross-Validation auf der
pipelinemitcross_val_score()durch. Übergib die Pipeline,pipeline, die Features,kidney_data, und die Zielwerte,y. Setze außerdemscoringauf"roc_auc"undcvauf3.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create full pipeline
pipeline = ____([
("____", ____),
("____", ____),
("____", ____),
("____", ____)
])
# Perform cross-validation
cross_val_scores = ____(____, ____, ____, ____="____", ____=____)
# Print avg. AUC
print("3-fold AUC: ", np.mean(cross_val_scores))