ComeçarComece de graça

Combinando ROS & RUS

Você pode combinar random over-sampling (ROS) e random under-sampling (RUS) para balancear a distribuição das classes. Você vai reequilibrar o conjunto de dados para que o novo conjunto tenha 10.000 transações, das quais 30% são fraudulentas.

Lembre-se: você pode sempre carregar o ROSE no console e digitar ?ovun.sample para conferir quais argumentos a função recebe.

Este exercício faz parte do curso

Detecção de Fraudes em R

Ver curso

Instruções do exercício

  • Carregue o pacote ROSE.
  • Defina n_new igual a 10.000 e fraud_fraction como 30%.
  • Use over e under-sampling.
  • Verifique o balanceamento das classes do conjunto de dados com under-sampling.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Load ROSE
___

# Specify the desired number of cases in the balanced dataset and the fraction of fraud cases
n_new <- ___
fraud_fraction <- ___

# Combine ROS & RUS!
sampling_result <- ___(___ = ___, ___ = ___,
                           ___ = ___, ___ = ___,  p = ___, seed = 2018)

# Verify the Class-balance of the re-balanced dataset
sampled_credit <- ___
prop.table(___(___))
Editar e executar o código