ComeçarComece de graça

Além da acurácia

Neste exercício, para ir além de olhar apenas a acurácia, você vai avaliar a AUC da curva ROC para um modelo básico de árvore de decisão. Lembre-se de que a comparação de base para um classificador aleatório é uma AUC de 0,5, então você vai querer alcançar uma pontuação maior que 0,5.

X está disponível como o DataFrame com as features, e y está disponível como um DataFrame com os valores de destino. Tanto sklearn quanto pandas como pd também estão disponíveis no seu ambiente.

Vamos usar essa configuração para observar a AUC da nossa curva ROC.

Este exercício faz parte do curso

Prevendo CTR com Machine Learning em Python

Ver curso

Instruções do exercício

  • Divida os dados em conjuntos de treino e teste.
  • Ajuste o classificador usando os dados de treino para fazer previsões nos dados de teste com predict_proba() e predict().
  • Avalie a AUC sob a curva ROC usando a função roc_curve() em y_test via roc_curve(y_test, y_score[:, 1]).

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Training and testing
X_train, X_test, y_train, y_test = \
	____(X, y, test_size = .2, random_state = 0)

# Create decision tree classifier
clf = DecisionTreeClassifier()

# Train classifier - predict probability score and label
y_score = clf.fit(____, ____).predict_proba(____) 
y_pred = clf.fit(____, ____).predict(____) 

# Get ROC curve metrics
fpr, tpr, thresholds = ____(____, y_score[:, 1])
roc_auc = auc(fpr, tpr)
print(roc_auc)
Editar e executar o código