Tief verschachtelte Daten verarbeiten
In der letzten Übung hast du Daten abgeflacht, die eine Ebene verschachtelt waren. Hier packst du stärker verschachtelte Daten aus.
Das Attribut categories in der Yelp-API-Antwort enthält Listen von Objekten. Um diese Daten abzuflachen, nutzt du Argumente von json_normalize(), um den Pfad zu categories anzugeben und weitere Attribute auszuwählen, die in den DataFrame aufgenommen werden sollen. Du solltest außerdem den Trenner ändern, um die Spaltenauswahl zu erleichtern, und die anderen Attribute mit einem Präfix versehen, um Kollisionen bei Spaltennamen zu vermeiden. Wir gehen das schrittweise durch.
pandas (als pd) und json_normalize() wurden importiert. JSON-formatierte Yelp-Daten zu Cafés in NYC sind als data gespeichert.
Diese Übung ist Teil des Kurses
Vereinfachte Datenaufnahme mit pandas
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Flatten businesses records and set underscore separators
flat_cafes = ____(data["businesses"],
____)
# View the data
print(flat_cafes.head())