Film annidati
Sei curioso di un insieme di dati movies che hai sul computer da un po', con informazioni su diversi film. Vorresti analizzarlo, ma ti accorgi che è in formato JSON annidato.
Per leggerlo in un DataFrame, dovrai usare la funzione che hai appena imparato. Dopo, rimodellerai il DataFrame risultante per renderlo più semplice da usare.
Il JSON semi-strutturato chiamato movies è a tua disposizione. Assicurati di esaminarlo nella console!
Questo esercizio fa parte del corso
Rimodellare i dati con pandas
Istruzioni dell'esercizio
- Importa la funzione
json_normalize()dapandas. - Normalizza il JSON contenuto in
movies. Separa i nomi generati dai record annidati con un underscore. - Rimodella il DataFrame risultante
movies_normda formato wide a long, usando le colonnedirectoreproducercome indici univoci. Assegna alla nuova variabile creata dalle colonnemoviesil nomefeatures, separato da un underscore con un suffisso contenente parole.
esercizio interattivo pratico
Prova questo esercizio completando questo codice di esempio.
# Import the json_normalize function
____
# Normalize movies and separate the new columns with an underscore
movies_norm = ____(____, sep=____)
# Reshape using director and producer as index, create movies from column starting from features
movies_long = pd.____(____, stubnames=____,
i=____, j=____,
sep=____, suffix=____)
# Print movies_long
print(movies_long)