Studio di caso sulla malattia renale III: pipeline completa
È il momento di mettere insieme tutte le trasformazioni insieme a un XGBClassifier per costruire la pipeline completa!
Oltre alla numeric_categorical_union che hai creato nell'esercizio precedente, servono altre due trasformazioni: la trasformazione Dictifier() che abbiamo creato per te e la DictVectorizer().
Dopo aver creato la pipeline, il tuo compito è eseguire una cross-validation per valutarne le prestazioni.
Questo esercizio fa parte del corso
Extreme Gradient Boosting con XGBoost
Istruzioni dell'esercizio
- Crea la pipeline usando le trasformazioni
numeric_categorical_union,Dictifier(), eDictVectorizer(sort=False), e l'estimatorexgb.XGBClassifier()conmax_depth=3. Assegna ai passaggi i nomi"featureunion","dictifier","vectorizer"e all'estimatore"clf". - Esegui una cross-validation a 3 fold sulla
pipelineusandocross_val_score(). Passa la pipeline,pipeline, le feature,kidney_data, gli esiti,y. Imposta inoltrescoringsu"roc_auc"ecvsu3.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create full pipeline
pipeline = ____([
("____", ____),
("____", ____),
("____", ____),
("____", ____)
])
# Perform cross-validation
cross_val_scores = ____(____, ____, ____, ____="____", ____=____)
# Print avg. AUC
print("3-fold AUC: ", np.mean(cross_val_scores))