Geneste films
Je bent nieuwsgierig naar een movies-gegevensset die al een tijd op je computer staat en gegevens over verschillende films bevat. Je wilt die gegevens analyseren, maar je merkt dat ze in een genest JSON-formaat staan.
Om dit in een DataFrame te lezen, moet je de functie gebruiken die je zojuist hebt geleerd. Daarna vorm je het resulterende DataFrame om, zodat het makkelijker is om mee te werken.
De semi-gestructureerde JSON met de naam movies is voor je beschikbaar. Zorg dat je deze in de console bekijkt!
Deze oefening maakt deel uit van de cursus
Data herstructureren met pandas
Oefeninstructies
- Importeer de functie
json_normalize()uitpandas. - Normaliseer de JSON in
movies. Scheid de namen die worden gegenereerd uit geneste records met een underscore. - Vorm het resulterende
movies_normDataFrame om van breed naar lang formaat, met de kolommendirectorenproducerals unieke indexen. Geef de nieuwe variabele die wordt gemaakt uit de kolommenmoviesde naam die begint metfeatures, gescheiden door een underscore met een suffix die woorden bevat.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the json_normalize function
____
# Normalize movies and separate the new columns with an underscore
movies_norm = ____(____, sep=____)
# Reshape using director and producer as index, create movies from column starting from features
movies_long = pd.____(____, stubnames=____,
i=____, j=____,
sep=____, suffix=____)
# Print movies_long
print(movies_long)