Combinar ROS y RUS
Puedes combinar el random over-sampling (ROS) y el random under-sampling (RUS) para equilibrar la distribución de clases. Vas a reequilibrar el conjunto de datos de modo que el nuevo conjunto contenga 10 000 transacciones, de las cuales el 30% sean fraudulentas.
Recuerda que siempre puedes cargar ROSE en la consola y escribir ?ovun.sample para consultar qué argumentos admite la función.
Este ejercicio forma parte del curso
Detección de fraude en R
Instrucciones del ejercicio
- Carga el paquete
ROSE. - Define
n_newigual a 10 000 yfraud_fractional 30%. - Usa tanto sobre- como submuestreo.
- Comprueba el equilibrio de clases del conjunto submuestreado.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Load ROSE
___
# Specify the desired number of cases in the balanced dataset and the fraction of fraud cases
n_new <- ___
fraud_fraction <- ___
# Combine ROS & RUS!
sampling_result <- ___(___ = ___, ___ = ___,
___ = ___, ___ = ___, p = ___, seed = 2018)
# Verify the Class-balance of the re-balanced dataset
sampled_credit <- ___
prop.table(___(___))