Lidar com dados profundamente aninhados
No exercício anterior, você achatou dados aninhados em um nível. Aqui, você vai desempacotar dados ainda mais profundos.
O atributo categories na resposta da API do Yelp contém listas de objetos. Para achatar esses dados, você vai usar argumentos de json_normalize() para especificar o caminho até categories e escolher outros atributos para incluir no dataframe. Você também deve mudar o separador para facilitar a seleção de colunas e adicionar um prefixo aos outros atributos para evitar colisões de nomes de colunas. Vamos fazer isso passo a passo.
pandas (como pd) e json_normalize() já foram importados. Os dados do Yelp em formato JSON sobre cafés em Nova York estão armazenados em data.
Este exercício faz parte do curso
Ingestão de dados simplificada com pandas
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Flatten businesses records and set underscore separators
flat_cafes = ____(data["businesses"],
____)
# View the data
print(flat_cafes.head())