Muster in den Daten visualisieren
Bevor du mit dem Modellieren beginnst, schaue dir deine Daten an. Untersuche zunächst den Datensatz und visualisiere unterschiedliche Muster zwischen betrügerischen und regulären Fällen. Ausnahmsweise baust du die Visualisierung selbst!
Der Datensatz transfers enthält Überweisungen, von denen einige als Betrug erfasst wurden. Die Spalte fraud_flag zeigt an, ob die Transaktion betrügerisch ist (fraud_flag = 1) oder nicht (fraud_flag = 0). Dieser Datensatz und das Paket ggplot2 sind in deinem Workspace geladen.
Diese Übung ist Teil des Kurses
Fraud Detection in R
Anleitung zur Übung
- Zeichne die Spalte
amountals unabhängige Variable auf die x‑Achse und die Spalteorig_balance_before– den Kontostand des Auftraggebers vor der Buchung der Überweisung – als abhängige Variable auf die y‑Achse. - Weise Farbe und Form der Daten anhand des Werts in der Spalte
fraud_flagzu.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Make a scatter plot
ggplot(transfers, aes(x = ___, y = ___)) +
geom_point(aes(color = ___, shape = ___)) +
scale_color_manual(values = c('dodgerblue', 'red'))