IniziaInizia gratis

Studio di caso sulla malattia renale III: pipeline completa

È il momento di mettere insieme tutte le trasformazioni insieme a un XGBClassifier per costruire la pipeline completa!

Oltre alla numeric_categorical_union che hai creato nell'esercizio precedente, servono altre due trasformazioni: la trasformazione Dictifier() che abbiamo creato per te e la DictVectorizer().

Dopo aver creato la pipeline, il tuo compito è eseguire una cross-validation per valutarne le prestazioni.

Questo esercizio fa parte del corso

Extreme Gradient Boosting con XGBoost

Visualizza il corso

Istruzioni dell'esercizio

  • Crea la pipeline usando le trasformazioni numeric_categorical_union, Dictifier(), e DictVectorizer(sort=False), e l'estimatore xgb.XGBClassifier() con max_depth=3. Assegna ai passaggi i nomi "featureunion", "dictifier", "vectorizer" e all'estimatore "clf".
  • Esegui una cross-validation a 3 fold sulla pipeline usando cross_val_score(). Passa la pipeline, pipeline, le feature, kidney_data, gli esiti, y. Imposta inoltre scoring su "roc_auc" e cv su 3.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create full pipeline
pipeline = ____([
                     ("____", ____),
                     ("____", ____),
                     ("____", ____),
                     ("____", ____)
                    ])

# Perform cross-validation
cross_val_scores = ____(____, ____, ____, ____="____", ____=____)

# Print avg. AUC
print("3-fold AUC: ", np.mean(cross_val_scores))
Modifica ed esegui il codice