Histogrammes pour détecter les valeurs aberrantes
Un histogramme est un excellent moyen visuel pour repérer des valeurs aberrantes. Elles deviennent visibles lorsqu’on choisit un nombre de classes adapté pour l’histogramme. Rappelez-vous que la racine carrée du nombre d’observations peut servir de règle empirique pour fixer le nombre de classes. En général, les barres les plus basses contiennent les valeurs aberrantes.
Dans cet exercice, vous allez tracer l’histogramme de prices de l’exercice précédent. numpy et matplotlib.pyplot sont disponibles avec leurs alias habituels.
Cet exercice fait partie du cours
Détection d’anomalies en Python
Instructions
- Calculez la racine carrée de la longueur de
priceset stockez-la dansn_bins. - Convertissez
n_binsen entier. - Créez un histogramme de
pricesen fixant le nombre de classes àn_bins.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Find the square root of the length of prices
n_bins = ____
# Cast to an integer
n_bins = ____(____)
plt.figure(figsize=(8, 4))
# Create a histogram
plt.____(____, ____=____, color='red')
plt.show()