Lidar com dados profundamente aninhados

No exercício anterior, você achatou dados aninhados em um nível. Aqui, você vai desempacotar dados ainda mais profundos.

O atributo categories na resposta da API do Yelp contém listas de objetos. Para achatar esses dados, você vai usar argumentos de json_normalize() para especificar o caminho até categories e escolher outros atributos para incluir no dataframe. Você também deve mudar o separador para facilitar a seleção de colunas e adicionar um prefixo aos outros atributos para evitar colisões de nomes de colunas. Vamos fazer isso passo a passo.

pandas (como pd) e json_normalize() já foram importados. Os dados do Yelp em formato JSON sobre cafés em Nova York estão armazenados em data.

Este exercicio faz parte do curso

Ingestão de dados simplificada com pandas

Ver curso

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Flatten businesses records and set underscore separators
flat_cafes = ____(data["businesses"],
                  ____)

# View the data
print(flat_cafes.head())

Editar e Executar Código