1. Apprendre
  2. /
  3. Cours
  4. /
  5. Manipulation de données avec pandas

Connected

Exercice

Compter des variables catégorielles

Compter est un excellent moyen d'avoir une vue d'ensemble de vos données et de repérer des particularités que vous n'auriez peut-être pas remarquées autrement. Dans cet exercice, vous allez compter le nombre de magasins pour chaque type de magasin et le nombre pour chaque numéro de département à l'aide des DataFrames que vous avez créés à l'exercice précédent :

# Supprimer les doublons de combinaisons magasin/type
store_types = sales.drop_duplicates(subset=["store", "type"])

# Supprimer les doublons de combinaisons magasin/département
store_depts = sales.drop_duplicates(subset=["store", "department"])

Les DataFrames store_types et store_depts que vous avez créés au dernier exercice sont disponibles, et pandas est importé sous le nom pd.

Instructions

100 XP
  • Comptez le nombre de magasins pour chaque type de magasin dans store_types.
  • Comptez la proportion de magasins pour chaque type de magasin dans store_types.
  • Comptez le nombre de magasins pour chaque department dans store_depts, en triant les décomptes par ordre décroissant.
  • Comptez la proportion de magasins pour chaque department dans store_depts, en triant les proportions par ordre décroissant.