Film annidati

Sei curioso di un insieme di dati movies che hai sul computer da un po', con informazioni su diversi film. Vorresti analizzarlo, ma ti accorgi che è in formato JSON annidato.

Per leggerlo in un DataFrame, dovrai usare la funzione che hai appena imparato. Dopo, rimodellerai il DataFrame risultante per renderlo più semplice da usare.

Il JSON semi-strutturato chiamato movies è a tua disposizione. Assicurati di esaminarlo nella console!

Questo esercizio fa parte del corso

Rimodellare i dati con pandas

Visualizza corso

Istruzioni dell'esercizio

Importa la funzione json_normalize() da pandas.
Normalizza il JSON contenuto in movies. Separa i nomi generati dai record annidati con un underscore.
Rimodella il DataFrame risultante movies_norm da formato wide a long, usando le colonne director e producer come indici univoci. Assegna alla nuova variabile creata dalle colonne movies il nome features, separato da un underscore con un suffisso contenente parole.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Import the json_normalize function
____

# Normalize movies and separate the new columns with an underscore 
movies_norm = ____(____, sep=____)

# Reshape using director and producer as index, create movies from column starting from features
movies_long = pd.____(____, stubnames=____, 
                      i=____, j=____, 
                      sep=____, suffix=____)

# Print movies_long
print(movies_long)

Modifica ed esegui il codice