ComeçarComece de graça

Usando classificação de ML para detectar fraude

Neste exercício, você verá o que acontece ao usar um modelo simples de Machine Learning em nossos dados de cartão de crédito.

Você acha que consegue superar aqueles resultados? Lembre-se: você previu 22 de 50 casos de fraude e teve 16 falsos positivos.

Com isso em mente, vamos implementar um modelo de Logistic Regression. Se você fez a aula de aprendizado supervisionado em Python, já deve conhecer esse modelo. Se não, pode valer a pena revisar agora. Mas não se preocupe: você será guiado pela estrutura do modelo de Machine Learning.

As variáveis X e y estão disponíveis no seu ambiente de trabalho.

Este exercício faz parte do curso

Detecção de Fraudes em Python

Ver curso

Instruções do exercício

  • Divida X e y em dados de treino e teste, mantendo 30% dos dados para teste.
  • Ajuste seu modelo aos dados de treino.
  • Obtenha os rótulos previstos pelo modelo executando model.predict em X_test.
  • Gere uma classificação comparando y_test com predicted e use a matriz de confusão fornecida para conferir seus resultados.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create the training and testing sets
X_train, X_test, y_train, y_test = train_test_split(____, ____, test_size=____, random_state=0)

# Fit a logistic regression model to our data
model = LogisticRegression()
model.fit(____, ____)

# Obtain model predictions
predicted = model.predict(____)

# Print the classifcation report and confusion matrix
print('Classification report:\n', classification_report(____, ____))
conf_mat = confusion_matrix(y_true=y_test, y_pred=predicted)
print('Confusion matrix:\n', conf_mat)
Editar e executar o código