Geneste films

Je bent nieuwsgierig naar een movies-gegevensset die al een tijd op je computer staat en gegevens over verschillende films bevat. Je wilt die gegevens analyseren, maar je merkt dat ze in een genest JSON-formaat staan.

Om dit in een DataFrame te lezen, moet je de functie gebruiken die je zojuist hebt geleerd. Daarna vorm je het resulterende DataFrame om, zodat het makkelijker is om mee te werken.

De semi-gestructureerde JSON met de naam movies is voor je beschikbaar. Zorg dat je deze in de console bekijkt!

Deze oefening maakt deel uit van de cursus

Data herstructureren met pandas

Bekijk cursus

Oefeninstructies

Importeer de functie json_normalize() uit pandas.
Normaliseer de JSON in movies. Scheid de namen die worden gegenereerd uit geneste records met een underscore.
Vorm het resulterende movies_norm DataFrame om van breed naar lang formaat, met de kolommen director en producer als unieke indexen. Geef de nieuwe variabele die wordt gemaakt uit de kolommen movies de naam die begint met features, gescheiden door een underscore met een suffix die woorden bevat.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Import the json_normalize function
____

# Normalize movies and separate the new columns with an underscore 
movies_norm = ____(____, sep=____)

# Reshape using director and producer as index, create movies from column starting from features
movies_long = pd.____(____, stubnames=____, 
                      i=____, j=____, 
                      sep=____, suffix=____)

# Print movies_long
print(movies_long)

Code bewerken en uitvoeren