Agregar y aplicar umbral a las probabilidades
Hay muchos métodos de agregación cuando usas ensembles. Los más populares son la media aritmética y la mediana.
Puedes usar la media casi siempre, y reservar la mediana para casos en los que tengas al menos tres clasificadores o más en tus estimators.
Usa el promedio aritmético para filtrar los outliers del conjunto de datos apple. probability_scores y apple están disponibles del ejercicio anterior. NumPy también está cargado.
Este ejercicio forma parte del curso
Detección de anomalías en Python
Instrucciones del ejercicio
- Calcula la media de
probability_scoresa lo largo de las filas. - Crea una máscara booleana que devuelva True cuando la probabilidad sea mayor que 0.75.
- Usa la máscara
is_outlierpara filtrar los outliers.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Find the mean across rows
mean_probs = ____
# Create a boolean mask that uses a 75% threshold
is_outlier = ____
# Use the mask to filter outliers from apple
outliers = ____
print(len(outliers))