Gestire dati annidati in profondità

Nell’ultimo esercizio hai appiattito dati annidati a un livello. Qui, decomprimerai dati annidati più in profondità.

L’attributo categories nella risposta dell’API di Yelp contiene liste di oggetti. Per appiattire questi dati, userai gli argomenti di json_normalize() per specificare il percorso verso categories e scegliere altri attributi da includere nel dataframe. Dovresti anche cambiare il separatore per facilitare la selezione delle colonne e aggiungere un prefisso agli altri attributi per evitare collisioni nei nomi delle colonne. Lo affronteremo passo dopo passo.

pandas (come pd) e json_normalize() sono già stati importati. I dati Yelp in formato JSON sui caffè a NYC sono salvati in data.

Questo esercizio fa parte del corso

Acquisizione dati semplificata con pandas

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Flatten businesses records and set underscore separators
flat_cafes = ____(data["businesses"],
                  ____)

# View the data
print(flat_cafes.head())

Modifica ed esegui il codice