IniziaInizia gratis

Combinare ROS e RUS

Puoi combinare sia il random over-sampling (ROS) sia il random under-sampling (RUS) per bilanciare la distribuzione delle classi. Ora riequilibrerai l'insieme di dati in modo che il nuovo insieme contenga 10.000 transazioni, di cui il 30% è fraudolento.

Ricorda che puoi sempre caricare ROSE nella console e digitare ?ovun.sample per controllare quali argomenti accetta la funzione.

Questo esercizio fa parte del corso

Rilevamento delle frodi in R

Visualizza il corso

Istruzioni dell'esercizio

  • Carica il pacchetto ROSE.
  • Imposta n_new uguale a 10.000 e fraud_fraction al 30%.
  • Usa sia over-sampling sia under-sampling.
  • Verifica il bilanciamento delle classi del dataset sotto-campionato.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Load ROSE
___

# Specify the desired number of cases in the balanced dataset and the fraction of fraud cases
n_new <- ___
fraud_fraction <- ___

# Combine ROS & RUS!
sampling_result <- ___(___ = ___, ___ = ___,
                           ___ = ___, ___ = ___,  p = ___, seed = 2018)

# Verify the Class-balance of the re-balanced dataset
sampled_credit <- ___
prop.table(___(___))
Modifica ed esegui il codice