ComenzarEmpieza gratis

Visualizar patrones en los datos

El primer paso antes de empezar a modelar es explorar tus datos. Empecemos examinando tu conjunto de datos y visualizando distintos patrones entre muestras fraudulentas y regulares. De forma excepcional, ¡vas a construir tú la visualización!

El conjunto de datos transfers contiene transferencias de crédito y algunas se registraron como fraude. La columna fraud_flag indica si la transacción es fraudulenta (fraud_flag = 1) o no (fraud_flag = 0). Este conjunto de datos y el paquete ggplot2 ya están cargados en tu espacio de trabajo.

Este ejercicio forma parte del curso

Detección de fraude en R

Ver curso

Instrucciones del ejercicio

  • Representa la columna amount como variable independiente en el eje x y la columna orig_balance_before, que es el saldo en la cuenta del ordenante antes de contabilizar la transferencia, como variable dependiente en el eje y.
  • Aplica color y forma a los datos según el valor de la columna fraud_flag.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Make a scatter plot
ggplot(transfers, aes(x = ___, y = ___)) +
  geom_point(aes(color = ___, shape = ___)) +
  scale_color_manual(values = c('dodgerblue', 'red'))
Editar y ejecutar código