Precisão e revocação
Tanto a precisão quanto a revocação estão relacionadas aos quatro resultados discutidos na aula anterior e são métricas de avaliação importantes para qualquer modelo de Machine Learning. Um modelo de CTR de anúncios idealmente deve ter alta precisão (alto ROI no gasto com anúncios) e alta revocação (segmentação de público relevante). Embora seja possível calcular precisão e revocação manualmente, o sklearn tem implementações práticas que você pode integrar facilmente ao fluxo de trabalho existente. Neste exercício, você vai configurar uma árvore de decisão e calcular precisão e revocação.
O módulo pandas está disponível como pd no seu ambiente e o DataFrame de exemplo está carregado como df. As variáveis de entrada estão em X e o alvo está em y para uso. Além disso, precision_score() e recall_score() de sklearn.metrics estão disponíveis.
Este exercício faz parte do curso
Prevendo CTR com Machine Learning em Python
Instruções do exercício
- Obtenha as divisões de treino e teste para
Xey. - Defina um classificador de árvore de decisão e gere as previsões
y_predajustando o modelo. - Use as implementações do
sklearnpara obter as pontuações de precisão e revocação.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Set up training and testing split
X_train, X_test, y_train, y_test = ____(
____, ____, test_size = .2, random_state = 0)
# Create classifier and make predictions
clf = ____
y_pred = clf.____(____, _____).____(X_test)
# Evaluate precision and recall
prec = ____(y_test, ____, average = 'weighted')
recall = ____(y_test, ____, average = 'weighted')
print("Precision: %s, Recall: %s" %(prec, recall))