Mit Statistik normales Verhalten definieren
In den vorherigen Übungen haben wir gesehen, dass Betrug in bestimmten Transaktionskategorien häufiger vorkommt, es aber keinen offensichtlichen Weg gibt, unsere Daten etwa nach Altersgruppen zu segmentieren. Dieses Mal untersuchen wir die durchschnittlichen ausgegebenen Beträge bei normalen gegenüber betrügerischen Transaktionen. So bekommst du ein Gefühl dafür, wie sich betrügerische Transaktionen strukturell von normalen unterscheiden.
Diese Übung ist Teil des Kurses
Betrugserkennung mit Python
Anleitung zur Übung
- Erstelle zwei neue DataFrames aus Betrugs- und Nicht-Betrugsbeobachtungen. Filtere die Daten in
dfmit.locund nutze die Bedingungen „wo fraud 1 ist“ und „wo fraud 0 ist“, um die neuen DataFrames zu erzeugen. - Plotte die Spalte
amountder neu erstellten DataFrames in den Histogrammfunktionen und weise den Plots jeweils die Labelsfraudbzw.nonfraudzu.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create two dataframes with fraud and non-fraud data
df_fraud = df.____[df.____ == ____]
df_non_fraud = df.____[df.____ == ____]
# Plot histograms of the amounts in fraud and non-fraud data
plt.hist(____.____, alpha=0.5, label='____')
plt.hist(____.____, alpha=0.5, label='____')
plt.legend()
plt.show()