Filmes aninhados
Você está curioso sobre um conjunto de dados movies que está no seu computador há algum tempo e que contém dados sobre diferentes filmes. Você gostaria de analisar esses dados, mas percebe que eles estão em um formato JSON aninhado.
Para lê-lo em um DataFrame, você precisará usar a função que acabou de aprender. Depois disso, você vai remodelar o DataFrame resultante para facilitar o trabalho.
O JSON semiestruturado chamado movies está disponível para você. Não deixe de examiná-lo no console!
Este exercício faz parte do curso
Reestruturando dados com pandas
Instruções do exercício
- Importe a função
json_normalize()depandas. - Normalize o JSON contido em
movies. Separe os nomes gerados a partir de registros aninhados com um sublinhado. - Remodele o DataFrame resultante
movies_normde formato wide para long, usando as colunasdirectoreproducercomo índices únicos. Dê o nome defeaturesà nova variável criada a partir das colunasmovies, começando comfeatures, separadas por um sublinhado com um sufixo contendo palavras.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import the json_normalize function
____
# Normalize movies and separate the new columns with an underscore
movies_norm = ____(____, sep=____)
# Reshape using director and producer as index, create movies from column starting from features
movies_long = pd.____(____, stubnames=____,
i=____, j=____,
sep=____, suffix=____)
# Print movies_long
print(movies_long)