Usare la classificazione ML per individuare le frodi
In questo esercizio vedrai cosa succede quando usi un semplice modello di Machine Learning sui nostri dati delle carte di credito.
Pensi di poter battere quei risultati? Ricorda: hai predetto 22 su 50 casi di frode e hai avuto 16 falsi positivi.
Con questo in mente, implementiamo un modello di Logistic Regression. Se hai seguito il corso sull’apprendimento supervisionato in Python, dovresti conoscerlo già. In caso contrario, potresti voler ripassare ora. Ma niente paura: ti guideremo attraverso la struttura del modello di Machine Learning.
Le variabili X e y sono disponibili nel tuo workspace.
Questo esercizio fa parte del corso
Rilevamento delle frodi in Python
Istruzioni dell'esercizio
- Suddividi
Xeyin training e test, mantenendo il 30% dei dati per il test. - Allena il modello sui dati di training.
- Ottieni le etichette predette eseguendo
model.predictsuX_test. - Genera una classificazione confrontando
y_testconpredictede usa la matrice di confusione fornita per verificare i risultati.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create the training and testing sets
X_train, X_test, y_train, y_test = train_test_split(____, ____, test_size=____, random_state=0)
# Fit a logistic regression model to our data
model = LogisticRegression()
model.fit(____, ____)
# Obtain model predictions
predicted = model.predict(____)
# Print the classifcation report and confusion matrix
print('Classification report:\n', classification_report(____, ____))
conf_mat = confusion_matrix(y_true=y_test, y_pred=predicted)
print('Confusion matrix:\n', conf_mat)