ComenzarEmpieza gratis

Distribución desbalanceada de clases

El conjunto de datos transfers contiene transferencias de crédito y algunas se registraron como fraude. La columna fraud_flag indica si la transacción es fraudulenta (fraud_flag = 1) o no (fraud_flag = 0).

Como el fraude suele ser muy poco frecuente, es importante tener en cuenta el gran desbalance entre el número de casos fraudulentos y los casos normales. Vamos a comprobar la proporción de casos legítimos y fraudulentos y a visualizar el desbalance con un gráfico de tarta.

El conjunto de datos transfers ya está cargado en tu espacio de trabajo. La parte de visualización está definida por ti, ya que la visualización de datos en general queda fuera del alcance de este curso.

Este ejercicio forma parte del curso

Detección de fraude en R

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Print the first 6 rows of the dataset
___(transfers)
Editar y ejecutar código