LoslegenKostenlos starten

Muster in den Daten visualisieren

Bevor du mit dem Modellieren beginnst, schaue dir deine Daten an. Untersuche zunächst den Datensatz und visualisiere unterschiedliche Muster zwischen betrügerischen und regulären Fällen. Ausnahmsweise baust du die Visualisierung selbst!

Der Datensatz transfers enthält Überweisungen, von denen einige als Betrug erfasst wurden. Die Spalte fraud_flag zeigt an, ob die Transaktion betrügerisch ist (fraud_flag = 1) oder nicht (fraud_flag = 0). Dieser Datensatz und das Paket ggplot2 sind in deinem Workspace geladen.

Diese Übung ist Teil des Kurses

<Kurs>Fraud Detection in R</Kurs>
Kurs ansehen

Übungsanweisungen

  • Zeichne die Spalte amount als unabhängige Variable auf die x‑Achse und die Spalte orig_balance_before – den Kontostand des Auftraggebers vor der Buchung der Überweisung – als abhängige Variable auf die y‑Achse.
  • Weise Farbe und Form der Daten anhand des Werts in der Spalte fraud_flag zu.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Make a scatter plot
ggplot(transfers, aes(x = ___, y = ___)) +
  geom_point(aes(color = ___, shape = ___)) +
  scale_color_manual(values = c('dodgerblue', 'red'))
Code bearbeiten und ausführen