CommencerCommencez gratuitement

Utiliser les probabilités d’anomalie

Une alternative à l’isolement des anomalies avec contamination consiste à utiliser les probabilités d’anomalie. L’avantage principal de cette méthode est que vous pouvez choisir un seuil de probabilité arbitraire, ce qui signifie que vous pouvez fixer le niveau de confiance que vous souhaitez pour les prédictions.

IForest et big_mart sont déjà chargés.

Cet exercice fait partie du cours

<cours>Détection d’anomalies en Python</cours>
Voir le cours

Instructions de l’exercice

  • Calculez les probabilités pour les observations normales et les anomalies.
  • Extrayez les probabilités d’anomalie dans outlier_probs.
  • Filtrez les anomalies dans outliers en utilisant un seuil de 70 % sur outlier_probs.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

iforest = IForest(random_state=10).fit(big_mart)

# Calculate probabilities
probs = iforest.____

# Extract the probabilities for outliers
outlier_probs = ____[____]

# Filter for when the probability is higher than 70%
outliers = ____[____]

print(len(outliers))
Modifier et exécuter le code