Usando probabilidades de outlier
Uma alternativa a isolar outliers com contamination é usar probabilidades de outlier. A melhor parte desse método é que você pode escolher um limiar de probabilidade arbitrário, o que significa que pode definir o nível de confiança que quiser nas previsões.
IForest e big_mart já estão carregados.
Este exercício faz parte do curso
Detecção de Anomalias em Python
Instruções do exercício
- Calcule as probabilidades para inliers e outliers.
- Extraia as probabilidades de outliers em
outlier_probs. - Filtre os outliers em
outliersusando um limiar de 70% emoutlier_probs.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
iforest = IForest(random_state=10).fit(big_mart)
# Calculate probabilities
probs = iforest.____
# Extract the probabilities for outliers
outlier_probs = ____[____]
# Filter for when the probability is higher than 70%
outliers = ____[____]
print(len(outliers))