Una novedad sencilla
Consideras que la detección de novedades es más útil que la detección de valores atípicos, pero quieres asegurarte de que funciona en el ejemplo simple que planteaste antes. Esta vez usarás una secuencia de treinta ejemplos, todos con valor 1.0, como conjunto de entrenamiento, e intentarás ver si el ejemplo 10.0 se etiqueta como novedad. Tienes acceso a pandas como pd y al módulo LocalOutlierFactor como lof.
Este ejercicio forma parte del curso
Diseño de flujos de trabajo de Machine Learning en Python
Instrucciones del ejercicio
- Crea un DataFrame de pandas con treinta ejemplos, todos iguales a
1.0. - Inicializa un detector de novedades con local outlier factor.
- Ajusta el detector a los datos de entrenamiento.
- Muestra la etiqueta de novedad del punto de datos
10.0, convertido a DataFrame.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a list of thirty 1s and cast to a dataframe
X = ____([1.0]*30)
# Create an instance of a lof novelty detector
detector = lof(____)
# Fit the detector to the data
detector.____(____)
# Use it to predict the label of an example with value 10.0
print(detector.____(____(____)))