Gestiona datos profundamente anidados

En el ejercicio anterior, aplanaste datos anidados a un nivel. Ahora, vas a desempaquetar datos con una anidación más profunda.

El atributo categories en la respuesta de la API de Yelp contiene listas de objetos. Para aplanar estos datos, usarás los argumentos de json_normalize() para indicar la ruta a categories y elegir otros atributos que quieras incluir en el dataframe. También debes cambiar el separador para facilitar la selección de columnas y añadir un prefijo a los demás atributos para evitar colisiones de nombres de columnas. Lo haremos paso a paso.

Se han importado pandas (como pd) y json_normalize(). Los datos de Yelp en formato JSON sobre cafeterías en NYC están guardados en data.

Este ejercicio forma parte del curso

Ingesta de datos eficiente con pandas

Ver curso

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Flatten businesses records and set underscore separators
flat_cafes = ____(data["businesses"],
                  ____)

# View the data
print(flat_cafes.head())

Editar y ejecutar código