Distribuição desequilibrada de classes
O conjunto de dados transfers contém transferências de crédito, e algumas foram registradas como fraude. A coluna fraud_flag indica se a transação é fraudulenta (fraud_flag = 1) ou não (fraud_flag = 0).
Como fraude costuma ser muito rara, é importante considerar o grande desequilíbrio entre o número de casos fraudulentos e casos regulares. Vamos verificar a fração de casos legítimos e fraudulentos e visualizar esse desequilíbrio com um gráfico de pizza.
O conjunto transfers já está carregado no seu ambiente. A parte de visualização foi definida para você, pois visualização de dados, em geral, está fora do escopo deste curso.
Este exercício faz parte do curso
Detecção de Fraudes em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Print the first 6 rows of the dataset
___(transfers)