SMOTE
Cuando uses SMOTE para hacer sobre-muestreo de la clase de fraudes, tienes que decidir cuántos vecinos más cercanos se tienen en cuenta y cuántos casos sintéticos de fraude crear. Los siguientes ejercicios te guiarán en el uso de SMOTE.
El conjunto de datos creditcard y las librerías smotefamily y ggplot2 ya están cargados en tu espacio de trabajo. Recuerda que el parámetro dup_size responde a la pregunta de cuántas veces debe SMOTE iterar sobre los casos de fraude reales existentes.
Este ejercicio forma parte del curso
Detección de fraude en R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Set the number of fraud and legitimate cases, and the desired percentage of legitimate cases
n0 <- ___; n1 <- ___; r0 <- ___