Usando classificação de ML para detectar fraude
Neste exercício, você verá o que acontece ao usar um modelo simples de Machine Learning em nossos dados de cartão de crédito.
Você acha que consegue superar aqueles resultados? Lembre-se: você previu 22 de 50 casos de fraude e teve 16 falsos positivos.
Com isso em mente, vamos implementar um modelo de Logistic Regression. Se você fez a aula de aprendizado supervisionado em Python, já deve conhecer esse modelo. Se não, pode valer a pena revisar agora. Mas não se preocupe: você será guiado pela estrutura do modelo de Machine Learning.
As variáveis X e y estão disponíveis no seu ambiente de trabalho.
Este exercício faz parte do curso
Detecção de Fraudes em Python
Instruções do exercício
- Divida
Xeyem dados de treino e teste, mantendo 30% dos dados para teste. - Ajuste seu modelo aos dados de treino.
- Obtenha os rótulos previstos pelo modelo executando
model.predictemX_test. - Gere uma classificação comparando
y_testcompredictede use a matriz de confusão fornecida para conferir seus resultados.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create the training and testing sets
X_train, X_test, y_train, y_test = train_test_split(____, ____, test_size=____, random_state=0)
# Fit a logistic regression model to our data
model = LogisticRegression()
model.fit(____, ____)
# Obtain model predictions
predicted = model.predict(____)
# Print the classifcation report and confusion matrix
print('Classification report:\n', classification_report(____, ____))
conf_mat = confusion_matrix(y_true=y_test, y_pred=predicted)
print('Confusion matrix:\n', conf_mat)