Ongelijke klassenverdeling
De gegevensset transfers bevat overboekingen, waarvan sommige als fraude zijn geregistreerd. De kolom fraud_flag geeft aan of de transactie frauduleus is (fraud_flag = 1) of niet (fraud_flag = 0).
Omdat fraude doorgaans heel zeldzaam is, is het belangrijk om rekening te houden met de grote scheefheid tussen het aantal frauduleuze en reguliere gevallen. Laten we het aandeel legitieme en frauduleuze gevallen bekijken en de ongelijkheid visualiseren met een taartdiagram.
De gegevensset transfers is geladen in je werkruimte. Het visualisatiegedeelte is voor je voorbereid, omdat datavisualisatie in het algemeen buiten de scope van deze cursus valt.
Deze oefening maakt deel uit van de cursus
Fraudedetectie in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Print the first 6 rows of the dataset
___(transfers)