Un outlier sencillo
Cuando te enfrentas por primera vez a un tipo de algoritmo, siempre es buena idea probarlo con un ejemplo muy simple. Así que decides crear una lista con treinta ejemplos con el valor 1.0 y solo un ejemplo con el valor 10.0, que esperas que se marque como outlier. Para asegurarte de usar el algoritmo correctamente, conviertes la lista en un dataframe de pandas y la pasas al algoritmo de local outlier factor. pandas está disponible como pd.
Este ejercicio forma parte del curso
Diseño de flujos de trabajo de Machine Learning en Python
Instrucciones del ejercicio
- Importa el módulo
LocalOutlierFactorcomolofpara mayor comodidad. - Crea una lista con treinta
1seguidos de un10,[1.0, 1.0, ..., 1.0, 10.0]. - Convierte la lista en un data frame.
- Imprime las puntuaciones de outlier producidas por el algoritmo de local outlier factor.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import the LocalOutlierFactor module
from sklearn.____ import ____ as lof
# Create the list [1.0, 1.0, ..., 1.0, 10.0] as explained
x = ____*30
x.____(10)
# Cast to a data frame
X = pd.____(x)
# Fit the local outlier factor and print the outlier scores
print(lof().____(X))