Trouver le z-score
Maintenant que vous connaissez la dispersion des tailles issues de l’enquête, vous souhaitez aller plus loin.
Rappelez-vous : une partie de l’enquête, young_people, demandait le Gender, l’Age, la Height et le Weight des répondants.
Dans cet exercice, vous allez identifier les valeurs aberrantes dans la colonne des tailles.
pandas et scipy.stats ont été importés pour vous sous les alias pd et stats.
Cet exercice fait partie du cours
Analyser des données d’enquête en Python
Instructions
- Calculez le z-score de la colonne
Height. - Repérez les valeurs aberrantes dans
Height_zscorepour cette enquête.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# z-score of `Height` column
young_people['Height_zscore'] = ____.____(young_people.____)
# Outliers in `Height_zscore`
height_outliers = young_people[
(young_people.____>=____)
|(young_people.____<=____)
]
print(height_outliers)