Coste de no detectar fraude
Cuando no se utiliza ningún modelo de detección, todas las transacciones del conjunto de datos transfers se consideran legítimas. Vas a determinar la matriz de confusión correspondiente. Aunque el fraude sea poco frecuente, las pérdidas económicas resultantes pueden ser enormes. Calcularás el coste total de no detectar las transferencias fraudulentas.
El paquete caret ya está cargado para que puedas construir confusionMatrix(). El conjunto de datos transfers está cargado en tu espacio de trabajo; no dudes en explorarlo en la Consola.
Este ejercicio forma parte del curso
Detección de fraude en R
Instrucciones del ejercicio
- Usa
rep.int()para crear un vector llamadopredictionsen el que todas las transferencias se predicen como legítimas (clase 0). No dudes en revisar las diapositivas para ver cómo se usó esta función en el vídeo. - Usa la función
confusionMatrix()del paquetecaretpara calcular la matriz de confusión depredictionsy la columnafraud_flagdetransfers. - Calcula el coste total de no detectar el fraude como la suma de los importes transferidos fraudulentos.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create vector predictions containing 0 for every transfer
predictions <- factor(___(___, times = ___(___)), levels = c(0, 1))
# Compute confusion matrix
confusionMatrix(data = ___, reference = ___)
# Compute cost of not detecting fraud
cost <- sum(___[___ == ___])
print(cost)