Films imbriqués

Vous êtes curieux d’un jeu de données movies que vous avez sur votre ordinateur depuis un moment et qui contient des informations sur différents films. Vous souhaitez l’analyser, mais vous constatez qu’il est au format JSON imbriqué.

Pour le lire dans un DataFrame, vous devrez utiliser la fonction que vous venez d’apprendre. Ensuite, vous remanierez le DataFrame obtenu pour le rendre plus facile à manipuler.

Le JSON semi-structuré nommé movies est à votre disposition. Pensez à l’examiner dans la console !

Cet exercice fait partie du cours

<cours>Reconfigurer les données avec pandas</cours>

Voir le cours

Instructions de l’exercice

Importez la fonction json_normalize() depuis pandas.
Normalisez le JSON contenu dans movies. Séparez les noms générés à partir des enregistrements imbriqués par un underscore.
Remodellez le DataFrame movies_norm obtenu du format large au format long, en utilisant les colonnes director et producer comme index uniques. Nommez la nouvelle variable créée à partir des colonnes movies, en commençant par features, séparée par un underscore avec un suffixe contenant des mots.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Import the json_normalize function
____

# Normalize movies and separate the new columns with an underscore 
movies_norm = ____(____, sep=____)

# Reshape using director and producer as index, create movies from column starting from features
movies_long = pd.____(____, stubnames=____, 
                      i=____, j=____, 
                      sep=____, suffix=____)

# Print movies_long
print(movies_long)

Modifier et exécuter le code