Diep geneste data verwerken

In de vorige oefening heb je data afgevlakt die één niveau genest was. Hier ga je data uitpakken die dieper genest is.

Het attribuut categories in de Yelp-API-respons bevat lijsten met objecten. Om deze data af te vlakken, gebruik je argumenten van json_normalize() om het pad naar categories op te geven en andere attributen te kiezen die je in de dataframe wilt opnemen. Je verandert ook de scheidingsteken om kolomselectie makkelijker te maken en voegt een prefix toe aan de andere attributen om botsende kolomnamen te voorkomen. We werken dit stap voor stap uit.

pandas (als pd) en json_normalize() zijn geïmporteerd. Yelp-gegevens in JSON-formaat over cafés in NYC zijn opgeslagen als data.

Deze oefening maakt deel uit van de cursus

Gestroomlijnde data-inname met pandas

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Flatten businesses records and set underscore separators
flat_cafes = ____(data["businesses"],
                  ____)

# View the data
print(flat_cafes.head())

Code bewerken en uitvoeren