1. Learn
  2. /
  3. Cursuri
  4. /
  5. Proiectarea fluxurilor de lucru pentru Machine Learning în Python

Connected

exercițiu

Contaminarea LoF

Consultantul tău medical de la startup-ul de aritmie te informează că datele de antrenament ar putea să nu conțină toate tipurile posibile de aritmie. Cum vei detecta aceste alte tipuri fără niciun exemplu etichetat? Oare un detector de anomalii ar putea diferenția între starea sănătoasă și cea patologică fără acces la etichete? Mai întâi, experimentează cu parametrul de contaminare pentru a-i observa efectul asupra matricei de confuzie. Ai LocalOutlierFactor disponibil ca lof, numpy ca np, etichetele ca ground_truth codificate în -1 și 1 exact ca ieșirea factorului local de outlieri, și datele de antrenament neetichetate ca X.

Instrucțiuni 1/3

undefined XP
  • 1

    Ajustează un factor local de outlieri, generează predicțiile pe X și afișează matricea de confuzie pentru aceste predicții.

  • 2

    Repetă, dar de această dată setează proporția de puncte de date marcate ca outlieri la 0,2. Afișează matricea de confuzie.

  • 3

    Acum setează contaminarea astfel încât să fie egală cu proporția reală de outlieri din date.