Zusammengefasste Kategorien
Ein Problem, das die Nutzer einer lokalen Hundeadoptions-Website geäußert haben, ist, dass es zu viele Optionen gibt. Wenn sie sich die verschiedenen Arten von Hunden ansehen, verlieren sie sich in der überwältigenden Auswahl. Um einige der Daten zu vereinfachen, gehst du jede Spalte einzeln durch und fasst die Kategorien bei Bedarf zusammen. Um die ursprünglichen Daten zu erhalten, erstellst du neue, aktualisierte Spalten im dogs Datensatz. Du beginnst mit der Spalte coat. Die Tabelle mit den Häufigkeiten findest du hier:
short 1969
medium 565
wirehaired 220
long 180
medium-long 3
Diese Übung ist Teil des Kurses
Arbeiten mit kategorialen Daten in Python
Anleitung zur Übung
- Erstelle ein Wörterbuch mit dem Namen
update_coats, um sowohlwirehairedals auchmedium-longaufmediumabzubilden. - Fasse die in diesem neuen Wörterbuch aufgeführten Kategorien zusammen und speichere sie als neue Spalte,
coat_collapsed. - Wandle diese neue Spalte in eine kategoriale Reihe um.
- Drucke die Tabelle mit der Häufigkeit dieser neuen Reihe.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create the update_coats dictionary
____
# Create a new column, coat_collapsed
dogs["coat_collapsed"] = ____
# Convert the column to categorical
____
# Print the frequency table
print(____)