ComeçarComece gratuitamente

Avaliar a árvore ideal

Neste exercício, você avaliará a pontuação do conjunto de teste ROC AUC do modelo ideal de grid_dt.

Para fazer isso, primeiro você determinará a probabilidade de obter o rótulo positivo para cada observação do conjunto de teste. Você pode usar o métodopredict_proba() de um classificador do sklearn para calcular uma matriz 2D contendo as probabilidades dos rótulos de classe negativo e positivo, respectivamente, ao longo das colunas.

O conjunto de dados já está carregado e processado para você (os recursos numéricos são padronizados); ele está dividido em 80% de treinamento e 20% de teste. X_test e y_test estão disponíveis em seu espaço de trabalho. Além disso, também carregamos o objeto GridSearchCV treinado grid_dt que você instanciou no exercício anterior. Observe que grid_dt foi treinado da seguinte forma:

grid_dt.fit(X_train, y_train)

Este exercício faz parte do curso

Aprendizado de máquina com modelos baseados em árvores em Python

Ver Curso

Instruções de exercício

  • Importe roc_auc_score de sklearn.metrics.

  • Extraia o atributo .best_estimator_ de grid_dt e atribua-o a best_model.

  • Preveja as probabilidades do conjunto de teste de obter a classe positiva y_pred_proba.

  • Calcule a pontuação do conjunto de teste ROC AUC test_roc_auc de best_model.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Import roc_auc_score from sklearn.metrics
____

# Extract the best estimator
best_model = ____

# Predict the test set probabilities of the positive class
y_pred_proba = ____

# Compute test_roc_auc
test_roc_auc = ____

# Print test_roc_auc
print('Test set ROC AUC score: {:.3f}'.format(test_roc_auc))
Editar e executar código