Baseline
Avaliar um classificador em relação a uma baseline apropriada é importante. Isso é ainda mais verdadeiro para conjuntos de dados desbalanceados, como cliques em anúncios, porque uma alta acurácia pode ser facilmente alcançada sempre escolhendo a classe majoritária. Neste exercício, você vai simular um classificador baseline que sempre prevê a classe majoritária (não clique) e observar sua matriz de confusão, além de ver quais são sua precisão e revocação.
X_train, y_train, X_test, y_test estão disponíveis no seu workspace. pandas como pd, numpy como np e sklearn também estão disponíveis no seu workspace.
Este exercício faz parte do curso
Prevendo CTR com Machine Learning em Python
Instruções do exercício
- Crie
y_pred, um array de zeros com o mesmo comprimento deX_test, usandonp.asarray(). - Imprima a matriz de confusão resultante.
- Obtenha as métricas de precisão e revocação.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Set up baseline predictions
y_pred = np.____([0 for x in range(len(X_test))])
# Look at confusion matrix
print("Confusion matrix: ")
print(____(y_test, y_pred))
# Check precision and recall
prec = ____(y_test, y_pred, average = 'weighted')
recall = ____(y_test, y_pred, average = 'weighted')
print("Precision: %s, Recall: %s" %(prec, recall))