or
Questo esercizio fa parte del corso
In questo capitolo vedrai come i riepiloghi numerici e grafici possano essere usati per valutare in modo informale se i dati contengono punti insoliti. Userai una procedura statistica chiamata test di Grubbs per verificare se un punto è un outlier e conoscerai l'algoritmo Seasonal-Hybrid ESD, che può aiutare a individuare outlier quando i dati sono una serie temporale.
In questo capitolo imparerai a calcolare la distanza dei k-nearest neighbors e il local outlier factor, utilizzati per costruire punteggi continui di anomalia per ciascun punto dati quando i dati hanno più caratteristiche. Capirai la differenza tra anomalie locali e globali e come i due algoritmi possano aiutare in ciascun caso.
k-nearest neighbors distance e local outlier factor usano la distanza o la densità relativa dei vicini più prossimi per assegnare un punteggio a ciascun punto. In questo capitolo esplorerai un approccio alternativo basato su alberi chiamato isolation forest, un metodo rapido e robusto per rilevare anomalie che misura quanto facilmente i punti possano essere separati dividendo casualmente i dati in regioni via via più piccole.
Ora hai conosciuto diversi algoritmi per il punteggio delle anomalie. In questo capitolo finale imparerai a confrontare le prestazioni di rilevamento degli algoritmi nei casi in cui siano disponibili anomalie etichettate. Imparerai a calcolare e interpretare le statistiche di precision e recall per un punteggio di anomalia e come adattare gli algoritmi per gestire dati con caratteristiche categoriche.
Esercizio attuale