1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Detekce podvodů v R

Connected

Cvičení

Zmenšení majoritní skupiny

Místo zvyšování počtu podvodných případů v datasetu můžeš náhodně odebrat legitimní transakce a tím dataset vyvážit. Pojďme podvzorkovat majoritní třídu (Class = 0) v datasetu creditcard. Pomocí table() v konzoli zjistíš, kolik podvodných a legitimních transakcí dataset obsahuje.

Pokyny

100 XP
  • Načti knihovnu ROSE.
  • Urči n_new jako požadovaný počet případů v podvzorkovaném datasetu tak, aby nový dataset obsahoval 40 % podvodných transakcí. K tomu vyděl počet podvodných případů požadovaným podílem podvodů v podvzorkovaném datasetu.
  • Proveď podvzorkování datasetu.
  • Pomocí table() a prop.table() zkontroluj rozložení tříd v podvzorkovaném datasetu.