Visualizar patrones en los datos
El primer paso antes de empezar a modelar es explorar tus datos. Empecemos examinando tu conjunto de datos y visualizando distintos patrones entre muestras fraudulentas y regulares. De forma excepcional, ¡vas a construir tú la visualización!
El conjunto de datos transfers contiene transferencias de crédito y algunas se registraron como fraude. La columna fraud_flag indica si la transacción es fraudulenta (fraud_flag = 1) o no (fraud_flag = 0). Este conjunto de datos y el paquete ggplot2 ya están cargados en tu espacio de trabajo.
Este ejercicio forma parte del curso
Detección de fraude en R
Instrucciones del ejercicio
- Representa la columna
amountcomo variable independiente en el eje x y la columnaorig_balance_before, que es el saldo en la cuenta del ordenante antes de contabilizar la transferencia, como variable dependiente en el eje y. - Aplica color y forma a los datos según el valor de la columna
fraud_flag.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Make a scatter plot
ggplot(transfers, aes(x = ___, y = ___)) +
geom_point(aes(color = ___, shape = ___)) +
scale_color_manual(values = c('dodgerblue', 'red'))