Filmes aninhados

Você está curioso sobre um conjunto de dados movies que está no seu computador há algum tempo e que contém dados sobre diferentes filmes. Você gostaria de analisar esses dados, mas percebe que eles estão em um formato JSON aninhado.

Para lê-lo em um DataFrame, você precisará usar a função que acabou de aprender. Depois disso, você vai remodelar o DataFrame resultante para facilitar o trabalho.

O JSON semiestruturado chamado movies está disponível para você. Não deixe de examiná-lo no console!

Este exercício faz parte do curso

Reestruturando dados com pandas

Instruções do exercício

Importe a função json_normalize() de pandas.
Normalize o JSON contido em movies. Separe os nomes gerados a partir de registros aninhados com um sublinhado.
Remodele o DataFrame resultante movies_norm de formato wide para long, usando as colunas director e producer como índices únicos. Dê o nome de features à nova variável criada a partir das colunas movies, começando com features, separadas por um sublinhado com um sufixo contendo palavras.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import the json_normalize function
____

# Normalize movies and separate the new columns with an underscore 
movies_norm = ____(____, sep=____)

# Reshape using director and producer as index, create movies from column starting from features
movies_long = pd.____(____, stubnames=____, 
                      i=____, j=____, 
                      sep=____, suffix=____)

# Print movies_long
print(movies_long)

Editar e executar o código

Este exercício faz parte do curso

Reestruturando dados com pandas

IntermediárioNível de habilidade

4.8+

Iniciar curso de graça

Vamos começar entendendo os conceitos de formatos wide e long e as vantagens de usar cada um. Em seguida, você vai aprender a pivotar dados do formato long para o formato wide e a obter estatísticas resumidas de um DataFrame grande.

Exercise 1: Formatos de dados wide e long Exercise 2: O longo e o largo Exercise 3: Invertendo jogadores Exercise 4: Reestruturando usando o método pivot Exercise 5: Driblando o método pivot Exercise 6: Jogador ofensivo ou defensivo?Exercise 7: Repita o último passo!Exercise 8: Tabelas dinâmicas Exercise 9: Revisando os movimentos Exercise 10: Explorando o grande clássico Exercise 11: O mais alto e o mais pesado

Domine a técnica de transformar DataFrames do formato wide para long. Neste capítulo, você vai aprender a usar o método de melting e a função wide to long, antes de descobrir como lidar com colunas de texto concatenando ou dividindo conteúdo.

Exercise 1: Reestruturando com melt Exercise 2: Tempos góticos Exercise 3: Avaliação não é tudo Exercise 4: Como está Frankenstein, Dorian Gray?Exercise 5: Função wide_to_long Exercise 6: A era de ouro Exercise 7: Desvendando o código Exercise 8: Hora de ler, Katniss!Exercise 9: Trabalhando com colunas de strings Exercise 10: Você disse distopia?Exercise 11: Qual é a sua avaliação, Harry?Exercise 12: Elementar, meu caro Watson!

Neste capítulo, você vai elevar suas habilidades de manipulação de dados usando indexação em múltiplos níveis. Você vai aprender a remodelar DataFrames rearranjando níveis dos índices de linha para o eixo de colunas, ou vice-versa. Também vai adquirir as habilidades necessárias para lidar com dados ausentes gerados nos processos de empilhamento e desempilhamento.

Exercise 1: Empilhando DataFrames Exercise 2: Empilhe as chamadas!Exercise 3: Índice de catálogo telefônico Exercise 4: Manda um texto!Exercise 5: Desempilhando DataFrames Exercise 6: Chamadas internacionais Exercise 7: Ligar outra vez Exercise 8: Organizando seu correio de voz Exercise 9: Trabalhando com vários níveis Exercise 10: Troque seu chip (SIM)Exercise 11: Chamadas demais Exercise 12: Tratando dados ausentes Exercise 13: Uma chamada perdida Exercise 14: Não derrube a pilha

Você vai encerrar aprendendo a combinar o processo de reestruturação com agrupamentos para realizar manipulações rápidas. Por fim, vai descobrir como transformar colunas com dados em formato de lista e lidar com dados aninhados complexos, como arquivos JSON aninhados.

Exercise 1: Reestruturando e combinando dados Exercise 2: Menos fast food, por favor!Exercise 3: Só subindo Exercise 4: Uma análise por grupo Exercise 5: Transformando uma coluna do tipo lista Exercise 6: Una tudo Exercise 7: Explodindo os limites Exercise 8: O bom e velho split Exercise 9: Lendo dados aninhados em um DataFrame Exercise 10: Filmes aninhados

Exercício atual

Exercise 11: Um filme complexo Exercise 12: Lidando com colunas de dados aninhados Exercise 13: Desaninhando aves Exercise 14: Não descarte o pássaro Exercise 15: A última transformação