ComenzarEmpieza gratis

Precisión y recall

Tanto la precisión como el recall están relacionados con los cuatro resultados que vimos en la lección anterior y son métricas de evaluación importantes para cualquier modelo de Machine Learning. Un modelo de CTR de anuncios debería idealmente tener alta precisión (alto ROI del gasto en anuncios) y alto recall (segmentación de audiencia relevante). Aunque es posible calcular precisión y recall a mano, sklearn tiene implementaciones muy útiles que puedes integrar fácilmente en tu flujo de trabajo. En este ejercicio, configurarás un árbol de decisión y calcularás la precisión y el recall.

El módulo pandas está disponible como pd en tu espacio de trabajo y el DataFrame de ejemplo está cargado como df. Las variables predictoras están en X y el objetivo está en y para su uso. Además, precision_score() y recall_score() de sklearn.metrics están disponibles.

Este ejercicio forma parte del curso

Predicción del CTR con Machine Learning en Python

Ver curso

Instrucciones del ejercicio

  • Obtén las particiones de entrenamiento y prueba para X y y.
  • Define un clasificador de árbol de decisión y genera las predicciones y_pred ajustando el modelo.
  • Usa las implementaciones de sklearn para obtener las puntuaciones de precisión y recall.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Set up training and testing split
X_train, X_test, y_train, y_test = ____(
  ____, ____, test_size = .2, random_state = 0)

# Create classifier and make predictions
clf = ____
y_pred = clf.____(____, _____).____(X_test) 

# Evaluate precision and recall
prec = ____(y_test, ____, average = 'weighted')
recall = ____(y_test, ____, average = 'weighted')
print("Precision: %s, Recall: %s" %(prec, recall))
Editar y ejecutar código