Films imbriqués
Vous êtes curieux d’un jeu de données movies que vous avez sur votre ordinateur depuis un moment et qui contient des informations sur différents films. Vous souhaitez l’analyser, mais vous constatez qu’il est au format JSON imbriqué.
Pour le lire dans un DataFrame, vous devrez utiliser la fonction que vous venez d’apprendre. Ensuite, vous remanierez le DataFrame obtenu pour le rendre plus facile à manipuler.
Le JSON semi-structuré nommé movies est à votre disposition. Pensez à l’examiner dans la console !
Cet exercice fait partie du cours
Reconfigurer les données avec pandas
Instructions
- Importez la fonction
json_normalize()depuispandas. - Normalisez le JSON contenu dans
movies. Séparez les noms générés à partir des enregistrements imbriqués par un underscore. - Remodellez le DataFrame
movies_normobtenu du format large au format long, en utilisant les colonnesdirectoretproducercomme index uniques. Nommez la nouvelle variable créée à partir des colonnesmovies, en commençant parfeatures, séparée par un underscore avec un suffixe contenant des mots.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the json_normalize function
____
# Normalize movies and separate the new columns with an underscore
movies_norm = ____(____, sep=____)
# Reshape using director and producer as index, create movies from column starting from features
movies_long = pd.____(____, stubnames=____,
i=____, j=____,
sep=____, suffix=____)
# Print movies_long
print(movies_long)