1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Detekce podvodů v R

Connected

Cvičení

Vizualizace vzorů v datech

Než začneš s modelováním, je důležité data nejprve prozkoumat. Podívejme se na datovou sadu zblízka a vizualizujme různé vzory mezi podvodnými a regulérními transakcemi. Tentokrát si vizualizaci sestavíš sám/a!

Dataset transfers obsahuje kreditní převody, přičemž část z nich byla označena jako podvod. Sloupec fraud_flag říká, zda je transakce podvodná (fraud_flag = 1), nebo ne (fraud_flag = 0). Tento dataset i balíček ggplot2 jsou v tvém pracovním prostředí již načteny.

Pokyny

100 XP
  • Vykresli sloupec amount jako nezávislou proměnnou na ose x a sloupec orig_balance_before, což je zůstatek na účtu odesílatele před zaúčtováním převodu, jako závislou proměnnou na ose y.
  • Barvu a tvar datových bodů nastav podle hodnot ve sloupci fraud_flag.