Usando classificação de ML para detectar fraude

Neste exercício, você verá o que acontece ao usar um modelo simples de Machine Learning em nossos dados de cartão de crédito.

Você acha que consegue superar aqueles resultados? Lembre-se: você previu 22 de 50 casos de fraude e teve 16 falsos positivos.

Com isso em mente, vamos implementar um modelo de Logistic Regression. Se você fez a aula de aprendizado supervisionado em Python, já deve conhecer esse modelo. Se não, pode valer a pena revisar agora. Mas não se preocupe: você será guiado pela estrutura do modelo de Machine Learning.

As variáveis X e y estão disponíveis no seu ambiente de trabalho.

Este exercicio faz parte do curso

Detecção de Fraudes em Python

Ver curso

Instruções do exercicio

Divida X e y em dados de treino e teste, mantendo 30% dos dados para teste.
Ajuste seu modelo aos dados de treino.
Obtenha os rótulos previstos pelo modelo executando model.predict em X_test.
Gere uma classificação comparando y_test com predicted e use a matriz de confusão fornecida para conferir seus resultados.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Create the training and testing sets
X_train, X_test, y_train, y_test = train_test_split(____, ____, test_size=____, random_state=0)

# Fit a logistic regression model to our data
model = LogisticRegression()
model.fit(____, ____)

# Obtain model predictions
predicted = model.predict(____)

# Print the classifcation report and confusion matrix
print('Classification report:\n', classification_report(____, ____))
conf_mat = confusion_matrix(y_true=y_test, y_pred=predicted)
print('Confusion matrix:\n', conf_mat)

Editar e Executar Código