Fallstudie Nierenerkrankungen III: Vollständige Pipeline

Jetzt ist es Zeit, alle Transforms zusammen mit einem XGBClassifier zu einer vollständigen Pipeline zusammenzufügen!

Neben der numeric_categorical_union, die du in der vorherigen Übung erstellt hast, werden zwei weitere Transforms benötigt: der Dictifier()-Transform, den wir für dich erstellt haben, und der DictVectorizer().

Nachdem du die Pipeline erstellt hast, sollst du sie per Cross-Validation evaluieren, um zu sehen, wie gut sie performt.

Diese Übung ist Teil des Kurses

Extreme Gradient Boosting mit XGBoost

Kurs anzeigen

Anleitung zur Übung

Erstelle die Pipeline mit den Transforms numeric_categorical_union, Dictifier() und DictVectorizer(sort=False) sowie dem Estimator xgb.XGBClassifier() mit max_depth=3. Benenne die Transforms "featureunion", "dictifier", "vectorizer" und den Estimator "clf".
Führe eine 3-fache Cross-Validation auf der pipeline mit cross_val_score() durch. Übergib die Pipeline, pipeline, die Features, kidney_data, und die Zielwerte, y. Setze außerdem scoring auf "roc_auc" und cv auf 3.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create full pipeline
pipeline = ____([
                     ("____", ____),
                     ("____", ____),
                     ("____", ____),
                     ("____", ____)
                    ])

# Perform cross-validation
cross_val_scores = ____(____, ____, ____, ____="____", ____=____)

# Print avg. AUC
print("3-fold AUC: ", np.mean(cross_val_scores))

Code bearbeiten und ausführen