Agrégation et seuillage des probabilités
De nombreuses méthodes d’agrégation existent pour les ensembles. Les plus courantes sont la moyenne arithmétique et la médiane.
Vous pouvez presque toujours utiliser la moyenne, tandis que vous réserverez la médiane aux cas où votre liste estimators contient au moins trois classifieurs.
Utilisez la moyenne arithmétique pour filtrer les valeurs aberrantes dans le jeu de données apple. probability_scores et apple sont disponibles depuis l’exercice précédent. NumPy est également importé.
Cet exercice fait partie du cours
Détection d’anomalies en Python
Instructions
- Calculez la moyenne de
probability_scoressur les lignes. - Créez un masque booléen qui renvoie True lorsque la probabilité est supérieure à 0,75.
- Utilisez le masque
is_outlierpour filtrer les valeurs aberrantes.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Find the mean across rows
mean_probs = ____
# Create a boolean mask that uses a 75% threshold
is_outlier = ____
# Use the mask to filter outliers from apple
outliers = ____
print(len(outliers))