ComeçarComece de graça

Baseline

Avaliar um classificador em relação a uma baseline apropriada é importante. Isso é ainda mais verdadeiro para conjuntos de dados desbalanceados, como cliques em anúncios, porque uma alta acurácia pode ser facilmente alcançada sempre escolhendo a classe majoritária. Neste exercício, você vai simular um classificador baseline que sempre prevê a classe majoritária (não clique) e observar sua matriz de confusão, além de ver quais são sua precisão e revocação.

X_train, y_train, X_test, y_test estão disponíveis no seu workspace. pandas como pd, numpy como np e sklearn também estão disponíveis no seu workspace.

Este exercício faz parte do curso

Prevendo CTR com Machine Learning em Python

Ver curso

Instruções do exercício

  • Crie y_pred, um array de zeros com o mesmo comprimento de X_test, usando np.asarray().
  • Imprima a matriz de confusão resultante.
  • Obtenha as métricas de precisão e revocação.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Set up baseline predictions
y_pred = np.____([0 for x in range(len(X_test))])

# Look at confusion matrix
print("Confusion matrix: ")
print(____(y_test, y_pred))

# Check precision and recall
prec = ____(y_test, y_pred, average = 'weighted')
recall = ____(y_test, y_pred, average = 'weighted')
print("Precision: %s, Recall: %s" %(prec, recall))
Editar e executar o código