LoslegenKostenlos loslegen

Muster in den Daten visualisieren

Bevor du mit dem Modellieren beginnst, schaue dir deine Daten an. Untersuche zunächst den Datensatz und visualisiere unterschiedliche Muster zwischen betrügerischen und regulären Fällen. Ausnahmsweise baust du die Visualisierung selbst!

Der Datensatz transfers enthält Überweisungen, von denen einige als Betrug erfasst wurden. Die Spalte fraud_flag zeigt an, ob die Transaktion betrügerisch ist (fraud_flag = 1) oder nicht (fraud_flag = 0). Dieser Datensatz und das Paket ggplot2 sind in deinem Workspace geladen.

Diese Übung ist Teil des Kurses

Fraud Detection in R

Kurs anzeigen

Anleitung zur Übung

  • Zeichne die Spalte amount als unabhängige Variable auf die x‑Achse und die Spalte orig_balance_before – den Kontostand des Auftraggebers vor der Buchung der Überweisung – als abhängige Variable auf die y‑Achse.
  • Weise Farbe und Form der Daten anhand des Werts in der Spalte fraud_flag zu.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Make a scatter plot
ggplot(transfers, aes(x = ___, y = ___)) +
  geom_point(aes(color = ___, shape = ___)) +
  scale_color_manual(values = c('dodgerblue', 'red'))
Code bearbeiten und ausführen