Comptage des variables catégorielles
Le comptage est un excellent moyen d'obtenir une vue d'ensemble de vos données et de repérer des curiosités que vous n'auriez peut-être pas remarquées autrement. Dans cet exercice, vous allez compter le nombre de chaque type de magasin et le nombre de chaque numéro de rayon en utilisant les DataFrames que vous avez créées dans l'exercice précédent :
# Drop duplicate store/type combinations
store_types = sales.drop_duplicates(subset=["store", "type"])
# Drop duplicate store/department combinations
store_depts = sales.drop_duplicates(subset=["store", "department"])
Les DataFrames store_types
et store_depts
que vous avez créés dans le dernier exercice sont disponibles, et pandas
est importé en tant que pd
.
Cet exercice fait partie du cours
Manipulation de données avec pandas
Instructions
- Comptez le nombre de points de vente de chaque magasin
type
surstore_types
. - Comptez la proportion de magasins de chaque enseigne
type
surstore_types
. - Comptez le nombre de magasins de chaque
department
dansstore_depts
, en triant les nombres par ordre décroissant. - Comptez la proportion de magasins de chaque
department
dansstore_depts
, en triant les proportions par ordre décroissant.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Count the number of stores of each type
store_counts = ____
print(store_counts)
# Get the proportion of stores of each type
store_props = ____
print(store_props)
# Count the number of stores for each department and sort
dept_counts_sorted = ____
print(dept_counts_sorted)
# Get the proportion of stores in each department and sort
dept_props_sorted = ____.____(sort=____, normalize=____)
print(dept_props_sorted)