Film annidati
Sei curioso di un insieme di dati movies che hai sul computer da un po', con informazioni su diversi film. Vorresti analizzarlo, ma ti accorgi che è in formato JSON annidato.
Per leggerlo in un DataFrame, dovrai usare la funzione che hai appena imparato. Dopo, rimodellerai il DataFrame risultante per renderlo più semplice da usare.
Il JSON semi-strutturato chiamato movies è a tua disposizione. Assicurati di esaminarlo nella console!
Questo esercizio fa parte del corso
Rimodellare i dati con pandas
Istruzioni dell'esercizio
- Importa la funzione
json_normalize()dapandas. - Normalizza il JSON contenuto in
movies. Separa i nomi generati dai record annidati con un underscore. - Rimodella il DataFrame risultante
movies_normda formato wide a long, usando le colonnedirectoreproducercome indici univoci. Assegna alla nuova variabile creata dalle colonnemoviesil nomefeatures, separato da un underscore con un suffisso contenente parole.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import the json_normalize function
____
# Normalize movies and separate the new columns with an underscore
movies_norm = ____(____, sep=____)
# Reshape using director and producer as index, create movies from column starting from features
movies_long = pd.____(____, stubnames=____,
i=____, j=____,
sep=____, suffix=____)
# Print movies_long
print(movies_long)