Diep geneste data verwerken
In de vorige oefening heb je data afgevlakt die één niveau genest was. Hier ga je data uitpakken die dieper genest is.
Het attribuut categories in de Yelp-API-respons bevat lijsten met objecten. Om deze data af te vlakken, gebruik je argumenten van json_normalize() om het pad naar categories op te geven en andere attributen te kiezen die je in de dataframe wilt opnemen. Je verandert ook de scheidingsteken om kolomselectie makkelijker te maken en voegt een prefix toe aan de andere attributen om botsende kolomnamen te voorkomen. We werken dit stap voor stap uit.
pandas (als pd) en json_normalize() zijn geïmporteerd. Yelp-gegevens in JSON-formaat over cafés in NYC zijn opgeslagen als data.
Deze oefening maakt deel uit van de cursus
Gestroomlijnde data-inname met pandas
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Flatten businesses records and set underscore separators
flat_cafes = ____(data["businesses"],
____)
# View the data
print(flat_cafes.head())