or
Este ejercicio forma parte del curso
En este capítulo, aprenderás cómo los resúmenes numéricos y gráficos pueden usarse para evaluar de forma informal si los datos contienen puntos inusuales. Utilizarás un procedimiento estadístico llamado prueba de Grubbs para comprobar si un punto es un valor atípico y conocerás el algoritmo Seasonal-Hybrid ESD, que puede ayudar a identificar valores atípicos cuando los datos forman una serie temporal.
En este capítulo, aprenderás a calcular la distancia de los k vecinos más cercanos y el local outlier factor, que se utilizan para construir puntuaciones de anomalía continuas para cada punto de datos cuando los datos tienen múltiples características. Aprenderás la diferencia entre anomalías locales y globales y cómo pueden ayudar ambos algoritmos en cada caso.
La distancia de los k vecinos más cercanos y el local outlier factor usan la distancia o la densidad relativa de los vecinos más cercanos para puntuar cada punto. En este capítulo, explorarás un enfoque alternativo basado en árboles llamado isolation forest, que es un método rápido y robusto para detectar anomalías y que mide lo fácilmente que se pueden separar los puntos dividiendo aleatoriamente los datos en regiones cada vez más pequeñas.
Ya has conocido varios algoritmos para puntuar anomalías. En este capítulo final, aprenderás a comparar el rendimiento de detección de los algoritmos en casos donde hay anomalías etiquetadas. Aprenderás a calcular e interpretar las estadísticas de precisión y exhaustividad (recall) para una puntuación de anomalía, y cómo adaptar los algoritmos para que puedan manejar datos con características categóricas.
Ejercicio actual