Combinare ROS e RUS
Puoi combinare sia il random over-sampling (ROS) sia il random under-sampling (RUS) per bilanciare la distribuzione delle classi. Ora riequilibrerai l'insieme di dati in modo che il nuovo insieme contenga 10.000 transazioni, di cui il 30% è fraudolento.
Ricorda che puoi sempre caricare ROSE nella console e digitare ?ovun.sample per controllare quali argomenti accetta la funzione.
Questo esercizio fa parte del corso
Rilevamento delle frodi in R
Istruzioni dell'esercizio
- Carica il pacchetto
ROSE. - Imposta
n_newuguale a 10.000 efraud_fractional 30%. - Usa sia over-sampling sia under-sampling.
- Verifica il bilanciamento delle classi del dataset sotto-campionato.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load ROSE
___
# Specify the desired number of cases in the balanced dataset and the fraction of fraud cases
n_new <- ___
fraud_fraction <- ___
# Combine ROS & RUS!
sampling_result <- ___(___ = ___, ___ = ___,
___ = ___, ___ = ___, p = ___, seed = 2018)
# Verify the Class-balance of the re-balanced dataset
sampled_credit <- ___
prop.table(___(___))