Categorieën samenvoegen
Een probleem dat gebruikers van een lokale hondenadoptiesite hebben aangegeven, is dat er te veel opties zijn. Terwijl ze de verschillende soorten honden bekijken, raken ze het overzicht kwijt door de enorme hoeveelheid keuze. Om sommige gegevens te vereenvoudigen, loop je elke kolom langs en voeg je gegevens samen waar dat zinvol is. Om de oorspronkelijke gegevens te behouden, maak je nieuwe bijgewerkte kolommen in de dogs-gegevensset. Je begint met de kolom coat. De frequentietabel staat hier:
short 1969
medium 565
wirehaired 220
long 180
medium-long 3
Deze oefening maakt deel uit van de cursus
Werken met categorische data in Python
Oefeninstructies
- Maak een dictionary
update_coatsdie zowelwirehairedalsmedium-longaanmediumkoppelt. - Voeg de categorieën samen zoals aangegeven in deze nieuwe dictionary en sla dit op als een nieuwe kolom
coat_collapsed. - Zet deze nieuwe kolom om naar een categorische Series.
- Print de frequentietabel van deze nieuwe Series.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create the update_coats dictionary
____
# Create a new column, coat_collapsed
dogs["coat_collapsed"] = ____
# Convert the column to categorical
____
# Print the frequency table
print(____)