Além da acurácia
Neste exercício, para ir além de olhar apenas a acurácia, você vai avaliar a AUC da curva ROC para um modelo básico de árvore de decisão. Lembre-se de que a comparação de base para um classificador aleatório é uma AUC de 0,5, então você vai querer alcançar uma pontuação maior que 0,5.
X está disponível como o DataFrame com as features, e y está disponível como um DataFrame com os valores de destino. Tanto sklearn quanto pandas como pd também estão disponíveis no seu ambiente.
Vamos usar essa configuração para observar a AUC da nossa curva ROC.
Este exercício faz parte do curso
Prevendo CTR com Machine Learning em Python
Instruções do exercício
- Divida os dados em conjuntos de treino e teste.
- Ajuste o classificador usando os dados de treino para fazer previsões nos dados de teste com
predict_proba()epredict(). - Avalie a AUC sob a curva ROC usando a função
roc_curve()emy_testviaroc_curve(y_test, y_score[:, 1]).
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Training and testing
X_train, X_test, y_train, y_test = \
____(X, y, test_size = .2, random_state = 0)
# Create decision tree classifier
clf = DecisionTreeClassifier()
# Train classifier - predict probability score and label
y_score = clf.fit(____, ____).predict_proba(____)
y_pred = clf.fit(____, ____).predict(____)
# Get ROC curve metrics
fpr, tpr, thresholds = ____(____, y_score[:, 1])
roc_auc = auc(fpr, tpr)
print(roc_auc)