Precisión y recall
Tanto la precisión como el recall están relacionados con los cuatro resultados que vimos en la lección anterior y son métricas de evaluación importantes para cualquier modelo de Machine Learning. Un modelo de CTR de anuncios debería idealmente tener alta precisión (alto ROI del gasto en anuncios) y alto recall (segmentación de audiencia relevante). Aunque es posible calcular precisión y recall a mano, sklearn tiene implementaciones muy útiles que puedes integrar fácilmente en tu flujo de trabajo. En este ejercicio, configurarás un árbol de decisión y calcularás la precisión y el recall.
El módulo pandas está disponible como pd en tu espacio de trabajo y el DataFrame de ejemplo está cargado como df. Las variables predictoras están en X y el objetivo está en y para su uso. Además, precision_score() y recall_score() de sklearn.metrics están disponibles.
Este ejercicio forma parte del curso
Predicción del CTR con Machine Learning en Python
Instrucciones del ejercicio
- Obtén las particiones de entrenamiento y prueba para
Xyy. - Define un clasificador de árbol de decisión y genera las predicciones
y_predajustando el modelo. - Usa las implementaciones de
sklearnpara obtener las puntuaciones de precisión y recall.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Set up training and testing split
X_train, X_test, y_train, y_test = ____(
____, ____, test_size = .2, random_state = 0)
# Create classifier and make predictions
clf = ____
y_pred = clf.____(____, _____).____(X_test)
# Evaluate precision and recall
prec = ____(y_test, ____, average = 'weighted')
recall = ____(y_test, ____, average = 'weighted')
print("Precision: %s, Recall: %s" %(prec, recall))