SMOTE
Quando usi SMOTE per fare over-sampling della classe dei casi di frode, devi decidere il numero di vicini più prossimi da considerare e quanti casi di frode sintetici creare. I seguenti esercizi ti guideranno nell’uso di SMOTE.
Il dataset creditcard e le librerie smotefamily e ggplot2 sono già caricate nel tuo workspace. Ricorda che il parametro dup_size risponde alla domanda: quante volte SMOTE deve iterare sui casi di frode reali esistenti.
Questo esercizio fa parte del corso
Rilevamento delle frodi in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Set the number of fraud and legitimate cases, and the desired percentage of legitimate cases
n0 <- ___; n1 <- ___; r0 <- ___