LoslegenKostenlos loslegen

Fallstudie Nierenerkrankungen III: Vollständige Pipeline

Jetzt ist es Zeit, alle Transforms zusammen mit einem XGBClassifier zu einer vollständigen Pipeline zusammenzufügen!

Neben der numeric_categorical_union, die du in der vorherigen Übung erstellt hast, werden zwei weitere Transforms benötigt: der Dictifier()-Transform, den wir für dich erstellt haben, und der DictVectorizer().

Nachdem du die Pipeline erstellt hast, sollst du sie per Cross-Validation evaluieren, um zu sehen, wie gut sie performt.

Diese Übung ist Teil des Kurses

Extreme Gradient Boosting mit XGBoost

Kurs anzeigen

Anleitung zur Übung

  • Erstelle die Pipeline mit den Transforms numeric_categorical_union, Dictifier() und DictVectorizer(sort=False) sowie dem Estimator xgb.XGBClassifier() mit max_depth=3. Benenne die Transforms "featureunion", "dictifier", "vectorizer" und den Estimator "clf".
  • Führe eine 3-fache Cross-Validation auf der pipeline mit cross_val_score() durch. Übergib die Pipeline, pipeline, die Features, kidney_data, und die Zielwerte, y. Setze außerdem scoring auf "roc_auc" und cv auf 3.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create full pipeline
pipeline = ____([
                     ("____", ____),
                     ("____", ____),
                     ("____", ____),
                     ("____", ____)
                    ])

# Perform cross-validation
cross_val_scores = ____(____, ____, ____, ____="____", ____=____)

# Print avg. AUC
print("3-fold AUC: ", np.mean(cross_val_scores))
Code bearbeiten und ausführen