Trouver le z-score
Maintenant que vous connaissez la dispersion des tailles issues de l’enquête, vous souhaitez aller plus loin.
Rappelez-vous : une partie de l’enquête, young_people, demandait le Gender, l’Age, la Height et le Weight des répondants.
Dans cet exercice, vous allez identifier les valeurs aberrantes dans la colonne des tailles.
pandas et scipy.stats ont été importés pour vous sous les alias pd et stats.
Cet exercice fait partie du cours
<cours>Analyser des données d’enquête en Python</cours>Instructions de l’exercice
- Calculez le z-score de la colonne
Height. - Repérez les valeurs aberrantes dans
Height_zscorepour cette enquête.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# z-score of `Height` column
young_people['Height_zscore'] = ____.____(young_people.____)
# Outliers in `Height_zscore`
height_outliers = young_people[
(young_people.____>=____)
|(young_people.____<=____)
]
print(height_outliers)