Categorische variabelen tellen
Tellen is een goede manier om snel een overzicht van je gegevens te krijgen en om bijzonderheden op te merken die je anders misschien mist. In deze oefening tel je het aantal winkels per type en het aantal per afdelingsnummer met behulp van de DataFrames die je in de vorige oefening hebt gemaakt:
# Drop duplicate store/type combinations
store_types = sales.drop_duplicates(subset=["store", "type"])
# Drop duplicate store/department combinations
store_depts = sales.drop_duplicates(subset=["store", "department"])
De DataFrames store_types en store_depts die je in de vorige oefening hebt gemaakt zijn beschikbaar, en pandas is geïmporteerd als pd.
Deze oefening maakt deel uit van de cursus
Datamanipulatie met pandas
Oefeninstructies
- Tel het aantal winkels per
typeinstore_types. - Tel de verhouding van winkels per
typeinstore_types. - Tel het aantal winkels per
departmentinstore_deptsen sorteer de tellingen in aflopende volgorde. - Tel de verhouding van winkels per
departmentinstore_deptsen sorteer de verhoudingen in aflopende volgorde.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Count the number of stores of each type
store_counts = ____
print(store_counts)
# Get the proportion of stores of each type
store_props = ____
print(store_props)
# Count the number of stores for each department and sort
dept_counts_sorted = ____
print(dept_counts_sorted)
# Get the proportion of stores in each department and sort
dept_props_sorted = ____.____(sort=____, normalize=____)
print(dept_props_sorted)