1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Detekce anomálií v Pythonu

Connected

cvičení

KNN s pravděpodobnostmi odlehlých hodnot

Výsledkům při použití parametru contamination nelze úplně důvěřovat – pojďme si naši práci ověřit pomocí pravděpodobností odlehlých hodnot. Ty jsou spolehlivější.

Dataset je načtený jako females a estimátor KNN je také naimportovaný.

Pokyny

100 XP
  • Vytvoř instanci KNN s 20 sousedy.
  • Vypočítej pravděpodobnosti odlehlých hodnot.
  • Vytvoř booleovskou masku, která vrací hodnotu true tam, kde je pravděpodobnost odlehlé hodnoty vyšší než 55 %.
  • Pomocí is_outlier vyfiltruj odlehlé hodnoty z females.