Estudo de caso sobre doença renal III: Pipeline completo
É hora de juntar todas as transformações com um XGBClassifier para construir o pipeline completo!
Além do numeric_categorical_union que você criou no exercício anterior, há duas outras transformações necessárias: a transformação Dictifier() que criamos para você e o DictVectorizer().
Depois de criar o pipeline, sua tarefa é validá-lo com cross-validation para ver seu desempenho.
Este exercício faz parte do curso
Extreme Gradient Boosting com XGBoost
Instruções do exercício
- Crie o pipeline usando as transformações
numeric_categorical_union,Dictifier()eDictVectorizer(sort=False), e o estimadorxgb.XGBClassifier()commax_depth=3. Dê os nomes"featureunion","dictifier","vectorizer"às transformações e"clf"ao estimador. - Faça uma cross-validation com 3 folds no
pipelineusandocross_val_score(). Passe o pipeline,pipeline, as features,kidney_data, e os resultados,y. Também definascoringcomo"roc_auc"ecvcomo3.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create full pipeline
pipeline = ____([
("____", ____),
("____", ____),
("____", ____),
("____", ____)
])
# Perform cross-validation
cross_val_scores = ____(____, ____, ____, ____="____", ____=____)
# Print avg. AUC
print("3-fold AUC: ", np.mean(cross_val_scores))