ComenzarEmpieza gratis

Películas anidadas

Sientes curiosidad por un conjunto de datos movies que tienes en tu ordenador desde hace tiempo y que contiene información sobre distintas películas. Te gustaría analizar esos datos, pero te das cuenta de que están en un formato JSON anidado.

Para leerlo en un DataFrame, necesitarás usar la función que acabas de aprender. Después, remodelarás el DataFrame resultante para que sea más fácil de trabajar.

El JSON semiestructurado llamado movies está disponible para ti. ¡Asegúrate de examinarlo en la consola!

Este ejercicio forma parte del curso

Reestructuración de datos con pandas

Ver curso

Instrucciones del ejercicio

  • Importa la función json_normalize() de pandas.
  • Normaliza el JSON contenido en movies. Separa los nombres generados a partir de registros anidados con un guion bajo.
  • Remodela el DataFrame resultante movies_norm de formato ancho a largo, usando las columnas director y producer como índices únicos. Pon nombre a la nueva variable creada a partir de las columnas movies, empezando por features, separada por un guion bajo y con un sufijo que contenga palabras.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import the json_normalize function
____

# Normalize movies and separate the new columns with an underscore 
movies_norm = ____(____, sep=____)

# Reshape using director and producer as index, create movies from column starting from features
movies_long = pd.____(____, stubnames=____, 
                      i=____, j=____, 
                      sep=____, suffix=____)

# Print movies_long
print(movies_long)
Editar y ejecutar código