Tief verschachtelte Daten verarbeiten

In der letzten Übung hast du Daten abgeflacht, die eine Ebene verschachtelt waren. Hier packst du stärker verschachtelte Daten aus.

Das Attribut categories in der Yelp-API-Antwort enthält Listen von Objekten. Um diese Daten abzuflachen, nutzt du Argumente von json_normalize(), um den Pfad zu categories anzugeben und weitere Attribute auszuwählen, die in den DataFrame aufgenommen werden sollen. Du solltest außerdem den Trenner ändern, um die Spaltenauswahl zu erleichtern, und die anderen Attribute mit einem Präfix versehen, um Kollisionen bei Spaltennamen zu vermeiden. Wir gehen das schrittweise durch.

pandas (als pd) und json_normalize() wurden importiert. JSON-formatierte Yelp-Daten zu Cafés in NYC sind als data gespeichert.

Diese Übung ist Teil des Kurses

<Kurs>Vereinfachte Datenaufnahme mit pandas</Kurs>

Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Flatten businesses records and set underscore separators
flat_cafes = ____(data["businesses"],
                  ____)

# View the data
print(flat_cafes.head())

Code bearbeiten und ausführen