Gestire dati annidati in profondità
Nell’ultimo esercizio hai appiattito dati annidati a un livello. Qui, decomprimerai dati annidati più in profondità.
L’attributo categories nella risposta dell’API di Yelp contiene liste di oggetti. Per appiattire questi dati, userai gli argomenti di json_normalize() per specificare il percorso verso categories e scegliere altri attributi da includere nel dataframe. Dovresti anche cambiare il separatore per facilitare la selezione delle colonne e aggiungere un prefisso agli altri attributi per evitare collisioni nei nomi delle colonne. Lo affronteremo passo dopo passo.
pandas (come pd) e json_normalize() sono già stati importati. I dati Yelp in formato JSON sui caffè a NYC sono salvati in data.
Questo esercizio fa parte del corso
Acquisizione dati semplificata con pandas
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Flatten businesses records and set underscore separators
flat_cafes = ____(data["businesses"],
____)
# View the data
print(flat_cafes.head())