ComeçarComece de graça

Distribuição desequilibrada de classes

O conjunto de dados transfers contém transferências de crédito, e algumas foram registradas como fraude. A coluna fraud_flag indica se a transação é fraudulenta (fraud_flag = 1) ou não (fraud_flag = 0).

Como fraude costuma ser muito rara, é importante considerar o grande desequilíbrio entre o número de casos fraudulentos e casos regulares. Vamos verificar a fração de casos legítimos e fraudulentos e visualizar esse desequilíbrio com um gráfico de pizza.

O conjunto transfers já está carregado no seu ambiente. A parte de visualização foi definida para você, pois visualização de dados, em geral, está fora do escopo deste curso.

Este exercício faz parte do curso

Detecção de Fraudes em R

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Print the first 6 rows of the dataset
___(transfers)
Editar e executar o código