Kosten van het niet detecteren van fraude
Als er geen detectiemodel wordt gebruikt, worden alle transacties in de transfers-gegevensset als legitiem beschouwd. Jij bepaalt de bijbehorende verwarringsmatrix. Hoewel fraude zeldzaam is, kunnen de financiële verliezen enorm zijn. Je berekent de totale kosten van het niet detecteren van de frauduleuze overboekingen.
Het pakket caret is al voor je geladen om de confusionMatrix() te construeren. De transfers-gegevensset is in je werkruimte geladen; aarzel niet om die te verkennen in de Console.
Deze oefening maakt deel uit van de cursus
Fraudedetectie in R
Oefeninstructies
- Gebruik
rep.int()om een vectorpredictionste maken waarin alle overboekingen als legitiem worden voorspeld (klasse 0). Kijk gerust even naar de dia's om te zien hoe deze functie in de video is gebruikt. - Gebruik de functie
confusionMatrix()uit hetcaret-pakket om de verwarringsmatrix te berekenen vanpredictionsen de kolomfraud_flaguittransfers. - Bereken de totale kosten van het niet detecteren van fraude als de som van de frauduleus overgeboekte bedragen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create vector predictions containing 0 for every transfer
predictions <- factor(___(___, times = ___(___)), levels = c(0, 1))
# Compute confusion matrix
confusionMatrix(data = ___, reference = ___)
# Compute cost of not detecting fraud
cost <- sum(___[___ == ___])
print(cost)