ComeçarComece de graça

Filmes aninhados

Você está curioso sobre um conjunto de dados movies que está no seu computador há algum tempo e que contém dados sobre diferentes filmes. Você gostaria de analisar esses dados, mas percebe que eles estão em um formato JSON aninhado.

Para lê-lo em um DataFrame, você precisará usar a função que acabou de aprender. Depois disso, você vai remodelar o DataFrame resultante para facilitar o trabalho.

O JSON semiestruturado chamado movies está disponível para você. Não deixe de examiná-lo no console!

Este exercício faz parte do curso

Reestruturando dados com pandas

Ver curso

Instruções do exercício

  • Importe a função json_normalize() de pandas.
  • Normalize o JSON contido em movies. Separe os nomes gerados a partir de registros aninhados com um sublinhado.
  • Remodele o DataFrame resultante movies_norm de formato wide para long, usando as colunas director e producer como índices únicos. Dê o nome de features à nova variável criada a partir das colunas movies, começando com features, separadas por um sublinhado com um sufixo contendo palavras.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import the json_normalize function
____

# Normalize movies and separate the new columns with an underscore 
movies_norm = ____(____, sep=____)

# Reshape using director and producer as index, create movies from column starting from features
movies_long = pd.____(____, stubnames=____, 
                      i=____, j=____, 
                      sep=____, suffix=____)

# Print movies_long
print(movies_long)
Editar e executar o código