Estudo de caso sobre doença renal III: Pipeline completo

É hora de juntar todas as transformações com um XGBClassifier para construir o pipeline completo!

Além do numeric_categorical_union que você criou no exercício anterior, há duas outras transformações necessárias: a transformação Dictifier() que criamos para você e o DictVectorizer().

Depois de criar o pipeline, sua tarefa é validá-lo com cross-validation para ver seu desempenho.

Este exercicio faz parte do curso

Extreme Gradient Boosting com XGBoost

Ver curso

Instruções do exercicio

Crie o pipeline usando as transformações numeric_categorical_union, Dictifier() e DictVectorizer(sort=False), e o estimador xgb.XGBClassifier() com max_depth=3. Dê os nomes "featureunion", "dictifier", "vectorizer" às transformações e "clf" ao estimador.
Faça uma cross-validation com 3 folds no pipeline usando cross_val_score(). Passe o pipeline, pipeline, as features, kidney_data, e os resultados, y. Também defina scoring como "roc_auc" e cv como 3.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Create full pipeline
pipeline = ____([
                     ("____", ____),
                     ("____", ____),
                     ("____", ____),
                     ("____", ____)
                    ])

# Perform cross-validation
cross_val_scores = ____(____, ____, ____, ____="____", ____=____)

# Print avg. AUC
print("3-fold AUC: ", np.mean(cross_val_scores))

Editar e Executar Código