Mit Statistik normales Verhalten definieren

In den vorherigen Übungen haben wir gesehen, dass Betrug in bestimmten Transaktionskategorien häufiger vorkommt, es aber keinen offensichtlichen Weg gibt, unsere Daten etwa nach Altersgruppen zu segmentieren. Dieses Mal untersuchen wir die durchschnittlichen ausgegebenen Beträge bei normalen gegenüber betrügerischen Transaktionen. So bekommst du ein Gefühl dafür, wie sich betrügerische Transaktionen strukturell von normalen unterscheiden.

Diese Übung ist Teil des Kurses

Betrugserkennung mit Python

Kurs anzeigen

Anleitung zur Übung

Erstelle zwei neue DataFrames aus Betrugs- und Nicht-Betrugsbeobachtungen. Filtere die Daten in df mit .loc und nutze die Bedingungen „wo fraud 1 ist“ und „wo fraud 0 ist“, um die neuen DataFrames zu erzeugen.
Plotte die Spalte amount der neu erstellten DataFrames in den Histogrammfunktionen und weise den Plots jeweils die Labels fraud bzw. nonfraud zu.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create two dataframes with fraud and non-fraud data 
df_fraud = df.____[df.____ == ____] 
df_non_fraud = df.____[df.____ == ____]

# Plot histograms of the amounts in fraud and non-fraud data 
plt.hist(____.____, alpha=0.5, label='____')
plt.hist(____.____, alpha=0.5, label='____')
plt.legend()
plt.show()

Code bearbeiten und ausführen