Películas anidadas
Sientes curiosidad por un conjunto de datos movies que tienes en tu ordenador desde hace tiempo y que contiene información sobre distintas películas. Te gustaría analizar esos datos, pero te das cuenta de que están en un formato JSON anidado.
Para leerlo en un DataFrame, necesitarás usar la función que acabas de aprender. Después, remodelarás el DataFrame resultante para que sea más fácil de trabajar.
El JSON semiestructurado llamado movies está disponible para ti. ¡Asegúrate de examinarlo en la consola!
Este ejercicio forma parte del curso
Reestructuración de datos con pandas
Instrucciones del ejercicio
- Importa la función
json_normalize()depandas. - Normaliza el JSON contenido en
movies. Separa los nombres generados a partir de registros anidados con un guion bajo. - Remodela el DataFrame resultante
movies_normde formato ancho a largo, usando las columnasdirectoryproducercomo índices únicos. Pon nombre a la nueva variable creada a partir de las columnasmovies, empezando porfeatures, separada por un guion bajo y con un sufijo que contenga palabras.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import the json_normalize function
____
# Normalize movies and separate the new columns with an underscore
movies_norm = ____(____, sep=____)
# Reshape using director and producer as index, create movies from column starting from features
movies_long = pd.____(____, stubnames=____,
i=____, j=____,
sep=____, suffix=____)
# Print movies_long
print(movies_long)