1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Detekce podvodů v R

Connected

Cvičení

Výpočet robustních z-skóre

Podíváme se znovu na datovou sadu transfers, kterou jsme použili v 1. kapitole. Dataset obsahuje 222 transakcí a čtyři známé případy podvodu, označené hodnotou 1 v proměnné fraud_flag. Vlastnosti frekvence a nedávnosti jsme už zkoumali dříve. Tentokrát se zaměříme pouze na proměnnou amount a pokusíme se odhalit podvodné případy pomocí technik detekce jednorozměrných odlehlých hodnot aplikovaných na tuto proměnnou.

Neváhej si datovou sadu prozkoumat v konzoli, pokud si potřebuješ osvěžit její strukturu. Funkce ukázané v předchozím videu najdeš také v prezentaci.

Pokyny

100 XP
  • Zjisti, která pozorování jsou označena jako podvod.
  • Vypočítej medián a střední absolutní odchylku (mad) pro proměnnou amount.
  • Pomocí robustních odhadů polohy a rozptylu vypočítej robustní z-skóre pro každé pozorování.
  • Která pozorování mají robustní z-skóre vyšší než 3 v absolutní hodnotě?