Utiliser efficacement les fonctions pandas
Vous créez une application Python qui calculera des statistiques récapitulatives en fonction des variables sélectionnées par l'utilisateur. L'ensemble des données est assez volumineux. Pour l'instant, vous configurez votre code en utilisant une partie de l'ensemble de données, préchargée sous le nom adult
. Lorsque vous créez un processus réutilisable, assurez-vous de réfléchir à la manière la plus efficace de configurer l'objet d'GroupBy
.
Cet exercice fait partie du cours
Utilisation de données catégorielles dans Python
Instructions
- Veuillez créer une liste des noms de deux variables sélectionnées par l'utilisateur :
"Education"
et"Above/Below 50k"
. - Créez un objet d'
GroupBy
,gb
, en utilisant l'user_list
comme variable de regroupement. - Calculez la moyenne de l'
"Hours/Week"
e dans chaque groupe en utilisant l'approche la plus efficace présentée dans la vidéo.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a list of user-selected variables
user_list = ____
# Create a GroupBy object using this list
gb = ____
# Find the mean for the variable "Hours/Week" for each group - Be efficient!
print(____)