1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Detekce podvodů v R

Connected

Cvičení

Náhodné převzorkování navýšením

Jen velmi malá část kreditních převodů je podvodná. Teď převzorkuješ podvodné případy navýšením, aby se vyrovnalo rozložení tříd. Příznak Class v datasetu creditcard nabývá hodnoty 1 v případě podvodu a 0 jinak.

Konzoli můžeš použít k zobrazení sloupců datasetu 'creditcard' pomocí str(), k výpisu prvních 6 řádků pomocí head() a ke kontrole vyváženosti třídy pomocí table(creditcard$Class).

Pokyny

100 XP
  • Načti balíček ROSE.
  • Urči n_new jako požadovaný počet případů v převzorkovaném datasetu tak, aby nový dataset obsahoval 30 % podvodných a tedy 70 % legitimních případů. K tomu vyděl stávající počet legitimních případů požadovaným podílem legitimních případů v převzorkovaném datasetu.
  • Použij funkci ovun.sample() pro převzorkování navýšením s Class ~ . jako vzorcem.
  • Zkontroluj vyváženost tříd v převzorkovaném datasetu.