IniziaInizia gratis

Film annidati

Sei curioso di un insieme di dati movies che hai sul computer da un po', con informazioni su diversi film. Vorresti analizzarlo, ma ti accorgi che è in formato JSON annidato.

Per leggerlo in un DataFrame, dovrai usare la funzione che hai appena imparato. Dopo, rimodellerai il DataFrame risultante per renderlo più semplice da usare.

Il JSON semi-strutturato chiamato movies è a tua disposizione. Assicurati di esaminarlo nella console!

Questo esercizio fa parte del corso

Rimodellare i dati con pandas

Visualizza il corso

Istruzioni dell'esercizio

  • Importa la funzione json_normalize() da pandas.
  • Normalizza il JSON contenuto in movies. Separa i nomi generati dai record annidati con un underscore.
  • Rimodella il DataFrame risultante movies_norm da formato wide a long, usando le colonne director e producer come indici univoci. Assegna alla nuova variabile creata dalle colonne movies il nome features, separato da un underscore con un suffisso contenente parole.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import the json_normalize function
____

# Normalize movies and separate the new columns with an underscore 
movies_norm = ____(____, sep=____)

# Reshape using director and producer as index, create movies from column starting from features
movies_long = pd.____(____, stubnames=____, 
                      i=____, j=____, 
                      sep=____, suffix=____)

# Print movies_long
print(movies_long)
Modifica ed esegui il codice