SMOTE
Ao usar SMOTE para superamostrar a classe de casos de fraude, você precisa decidir o número de vizinhos mais próximos a considerar e quantos casos de fraude sintéticos criar. Os exercícios a seguir vão orientar você no uso do SMOTE.
O conjunto de dados creditcard e as bibliotecas smotefamily e ggplot2 já estão carregados no seu ambiente. Lembre-se de que o parâmetro dup_size responde à pergunta de quantas vezes o SMOTE deve percorrer os casos de fraude reais existentes.
Este exercício faz parte do curso
Detecção de Fraudes em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Set the number of fraud and legitimate cases, and the desired percentage of legitimate cases
n0 <- ___; n1 <- ___; r0 <- ___