LoslegenKostenlos loslegen

ROS & RUS kombinieren

Du kannst Random Over-Sampling (ROS) und Random Under-Sampling (RUS) kombinieren, um die Klassenverteilung auszugleichen. Du wirst den Datensatz so anpassen, dass der neue Datensatz 10.000 Transaktionen enthält, von denen 30 % betrügerisch sind.

Denk daran: Du kannst ROSE jederzeit in der Konsole laden und ?ovun.sample eingeben, um zu sehen, welche Argumente die Funktion erwartet.

Diese Übung ist Teil des Kurses

Fraud Detection in R

Kurs anzeigen

Anleitung zur Übung

  • Lade das Paket ROSE.
  • Setze n_new auf 10.000 und fraud_fraction auf 30 %.
  • Verwende sowohl Over- als auch Under-Sampling.
  • Prüfe die Klassenbalance des unterstichprobenbasierten Datensatzes.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Load ROSE
___

# Specify the desired number of cases in the balanced dataset and the fraction of fraud cases
n_new <- ___
fraud_fraction <- ___

# Combine ROS & RUS!
sampling_result <- ___(___ = ___, ___ = ___,
                           ___ = ___, ___ = ___,  p = ___, seed = 2018)

# Verify the Class-balance of the re-balanced dataset
sampled_credit <- ___
prop.table(___(___))
Code bearbeiten und ausführen