Usare la classificazione ML per individuare le frodi

In questo esercizio vedrai cosa succede quando usi un semplice modello di Machine Learning sui nostri dati delle carte di credito.

Pensi di poter battere quei risultati? Ricorda: hai predetto 22 su 50 casi di frode e hai avuto 16 falsi positivi.

Con questo in mente, implementiamo un modello di Logistic Regression. Se hai seguito il corso sull’apprendimento supervisionato in Python, dovresti conoscerlo già. In caso contrario, potresti voler ripassare ora. Ma niente paura: ti guideremo attraverso la struttura del modello di Machine Learning.

Le variabili X e y sono disponibili nel tuo workspace.

Questo esercizio fa parte del corso

Rilevamento delle frodi in Python

Visualizza corso

Istruzioni dell'esercizio

Suddividi X e y in training e test, mantenendo il 30% dei dati per il test.
Allena il modello sui dati di training.
Ottieni le etichette predette eseguendo model.predict su X_test.
Genera una classificazione confrontando y_test con predicted e usa la matrice di confusione fornita per verificare i risultati.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Create the training and testing sets
X_train, X_test, y_train, y_test = train_test_split(____, ____, test_size=____, random_state=0)

# Fit a logistic regression model to our data
model = LogisticRegression()
model.fit(____, ____)

# Obtain model predictions
predicted = model.predict(____)

# Print the classifcation report and confusion matrix
print('Classification report:\n', classification_report(____, ____))
conf_mat = confusion_matrix(y_true=y_test, y_pred=predicted)
print('Confusion matrix:\n', conf_mat)

Modifica ed esegui il codice