Avaliar a árvore ideal
Neste exercício, você avaliará a pontuação do conjunto de teste ROC AUC do modelo ideal de grid_dt
.
Para fazer isso, primeiro você determinará a probabilidade de obter o rótulo positivo para cada observação do conjunto de teste. Você pode usar o métodopredict_proba()
de um classificador do sklearn para calcular uma matriz 2D contendo as probabilidades dos rótulos de classe negativo e positivo, respectivamente, ao longo das colunas.
O conjunto de dados já está carregado e processado para você (os recursos numéricos são padronizados); ele está dividido em 80% de treinamento e 20% de teste. X_test
e y_test
estão disponíveis em seu espaço de trabalho. Além disso, também carregamos o objeto GridSearchCV
treinado grid_dt
que você instanciou no exercício anterior. Observe que grid_dt
foi treinado da seguinte forma:
grid_dt.fit(X_train, y_train)
Este exercício faz parte do curso
Aprendizado de máquina com modelos baseados em árvores em Python
Instruções de exercício
Importe
roc_auc_score
desklearn.metrics
.Extraia o atributo
.best_estimator_
degrid_dt
e atribua-o abest_model
.Preveja as probabilidades do conjunto de teste de obter a classe positiva
y_pred_proba
.Calcule a pontuação do conjunto de teste ROC AUC
test_roc_auc
debest_model
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Import roc_auc_score from sklearn.metrics
____
# Extract the best estimator
best_model = ____
# Predict the test set probabilities of the positive class
y_pred_proba = ____
# Compute test_roc_auc
test_roc_auc = ____
# Print test_roc_auc
print('Test set ROC AUC score: {:.3f}'.format(test_roc_auc))