ComenzarEmpieza gratis

Combinar ROS y RUS

Puedes combinar el random over-sampling (ROS) y el random under-sampling (RUS) para equilibrar la distribución de clases. Vas a reequilibrar el conjunto de datos de modo que el nuevo conjunto contenga 10 000 transacciones, de las cuales el 30% sean fraudulentas.

Recuerda que siempre puedes cargar ROSE en la consola y escribir ?ovun.sample para consultar qué argumentos admite la función.

Este ejercicio forma parte del curso

Detección de fraude en R

Ver curso

Instrucciones del ejercicio

  • Carga el paquete ROSE.
  • Define n_new igual a 10 000 y fraud_fraction al 30%.
  • Usa tanto sobre- como submuestreo.
  • Comprueba el equilibrio de clases del conjunto submuestreado.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Load ROSE
___

# Specify the desired number of cases in the balanced dataset and the fraction of fraud cases
n_new <- ___
fraud_fraction <- ___

# Combine ROS & RUS!
sampling_result <- ___(___ = ___, ___ = ___,
                           ___ = ___, ___ = ___,  p = ___, seed = 2018)

# Verify the Class-balance of the re-balanced dataset
sampled_credit <- ___
prop.table(___(___))
Editar y ejecutar código