ComenzarEmpieza gratis

SMOTE

Cuando uses SMOTE para hacer sobre-muestreo de la clase de fraudes, tienes que decidir cuántos vecinos más cercanos se tienen en cuenta y cuántos casos sintéticos de fraude crear. Los siguientes ejercicios te guiarán en el uso de SMOTE.

El conjunto de datos creditcard y las librerías smotefamily y ggplot2 ya están cargados en tu espacio de trabajo. Recuerda que el parámetro dup_size responde a la pregunta de cuántas veces debe SMOTE iterar sobre los casos de fraude reales existentes.

Este ejercicio forma parte del curso

Detección de fraude en R

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Set the number of fraud and legitimate cases, and the desired percentage of legitimate cases
n0 <- ___; n1 <- ___; r0 <- ___
Editar y ejecutar código