Modelo de referencia
Evaluar un clasificador en relación con un modelo de referencia adecuado es importante. Esto es especialmente cierto en conjuntos de datos desbalanceados, como el click-through de anuncios, porque se puede lograr una alta exactitud simplemente eligiendo siempre la clase mayoritaria. En este ejercicio, vas a simular un clasificador de referencia que siempre predice la clase mayoritaria (no clic) y ver su matriz de confusión, así como su precisión y su recall.
X_train, y_train, X_test, y_test están disponibles en tu espacio de trabajo. pandas como pd, numpy como np y sklearn también están disponibles en tu espacio de trabajo.
Este ejercicio forma parte del curso
Predicción del CTR con Machine Learning en Python
Instrucciones del ejercicio
- Crea
y_pred, un array de ceros con la misma longitud queX_testusandonp.asarray(). - Imprime la matriz de confusión resultante.
- Obtén las métricas de precisión y recall.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Set up baseline predictions
y_pred = np.____([0 for x in range(len(X_test))])
# Look at confusion matrix
print("Confusion matrix: ")
print(____(y_test, y_pred))
# Check precision and recall
prec = ____(y_test, y_pred, average = 'weighted')
recall = ____(y_test, y_pred, average = 'weighted')
print("Precision: %s, Recall: %s" %(prec, recall))