1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Detekce podvodů v R

Connected

Cvičení

SMOTE

Při použití SMOTE k převzorkování třídy podvodných případů musíš rozhodnout, kolik nejbližších sousedů se bere v úvahu a kolik syntetických podvodných případů vytvořit. Následující cvičení tě provedou použitím SMOTE.

Dataset creditcard a knihovny smotefamily a ggplot2 jsou již načteny v tvém pracovním prostředí. Pamatuj, že parametr dup_size odpovídá na otázku, kolikrát má SMOTE projít existujícími, reálnými podvodnými případy.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Zjisti počet legitimních (n0) a podvodných (n1) případů a nastav požadovaný podíl (r0) legitimních případů na 60 %.