Combinando ROS & RUS
Você pode combinar random over-sampling (ROS) e random under-sampling (RUS) para balancear a distribuição das classes. Você vai reequilibrar o conjunto de dados para que o novo conjunto tenha 10.000 transações, das quais 30% são fraudulentas.
Lembre-se: você pode sempre carregar o ROSE no console e digitar ?ovun.sample para conferir quais argumentos a função recebe.
Este exercício faz parte do curso
Detecção de Fraudes em R
Instruções do exercício
- Carregue o pacote
ROSE. - Defina
n_newigual a 10.000 efraud_fractioncomo 30%. - Use over e under-sampling.
- Verifique o balanceamento das classes do conjunto de dados com under-sampling.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Load ROSE
___
# Specify the desired number of cases in the balanced dataset and the fraction of fraud cases
n_new <- ___
fraud_fraction <- ___
# Combine ROS & RUS!
sampling_result <- ___(___ = ___, ___ = ___,
___ = ___, ___ = ___, p = ___, seed = 2018)
# Verify the Class-balance of the re-balanced dataset
sampled_credit <- ___
prop.table(___(___))