Afficher un résumé en 5 nombres
L’un des moyens les plus rapides pour se faire une idée de nouvelles données est le résumé en 5 nombres. Il affiche 5 indicateurs d’une distribution — le minimum, le 25e centile, la médiane, le 75e centile et le maximum — ainsi que la moyenne et l’écart type. En observant ce résumé et l’écart entre la moyenne et les valeurs minimale/maximale, vous pouvez vous faire une première idée de la présence d’éventuelles valeurs aberrantes dans la distribution.
Dans les exercices de ce chapitre, vous utiliserez les méthodes présentées dans les vidéos pour détecter les prix des annonces Airbnb les plus chères (ou les moins chères) aux États‑Unis. Le jeu de données a été chargé dans airbnb_df sous forme de DataFrame pandas.
Cet exercice fait partie du cours
Détection d’anomalies en Python
Instructions
- Extrayez la colonne
pricedes annonces Airbnb aux États‑Unis dansprices. - Affichez le résumé en 5 nombres de la distribution
prices.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Extract price
prices = ____
# Print 5-number summary
print(prices.____)