Betrug mit ML-Klassifikation aufdecken
In dieser Übung siehst du, was passiert, wenn du stattdessen ein einfaches Machine-Learning-Modell auf unsere Kreditkartendaten anwendest.
Meinst du, du kannst die bisherigen Ergebnisse schlagen? Zur Erinnerung: Du hast 22 von 50 Betrugsfällen vorhergesagt und 16 False Positives erzeugt.
Mit diesem Ziel implementieren wir nun ein Logistic Regression-Modell. Wenn du den Kurs zu Supervised Learning in Python gemacht hast, kennst du dieses Modell bereits. Falls nicht, kannst du das jetzt kurz auffrischen. Keine Sorge, wir führen dich durch den Aufbau des Machine-Learning-Modells.
Die Variablen X und y stehen in deinem Workspace bereit.
Diese Übung ist Teil des Kurses
Betrugserkennung mit Python
Anleitung zur Übung
- Teile
Xundyin Trainings- und Testdaten auf, wobei 30 % der Daten für den Test zurückgehalten werden. - Fitte dein Modell auf die Trainingsdaten.
- Erhalte die vom Modell vorhergesagten Labels, indem du
model.predictaufX_testanwendest. - Erzeuge einen Klassifikationsbericht, indem du
y_testmitpredictedvergleichst, und nutze die angegebene Konfusionsmatrix, um deine Ergebnisse zu prüfen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create the training and testing sets
X_train, X_test, y_train, y_test = train_test_split(____, ____, test_size=____, random_state=0)
# Fit a logistic regression model to our data
model = LogisticRegression()
model.fit(____, ____)
# Obtain model predictions
predicted = model.predict(____)
# Print the classifcation report and confusion matrix
print('Classification report:\n', classification_report(____, ____))
conf_mat = confusion_matrix(y_true=y_test, y_pred=predicted)
print('Confusion matrix:\n', conf_mat)