Verschachtelte Filme
Du bist neugierig auf einen movies-Datensatz, der schon seit einiger Zeit auf deinem Computer liegt und Daten zu verschiedenen Filmen enthält. Du möchtest diese Daten analysieren, stellst aber fest, dass sie im verschachtelten JSON-Format vorliegen.
Um ihn in ein DataFrame einzulesen, musst du die Funktion verwenden, die du gerade gelernt hast. Danach formst du das resultierende DataFrame um, damit es leichter zu bearbeiten ist.
Das semi-strukturierte JSON namens movies steht dir zur Verfügung. Schau es dir unbedingt in der Konsole an!
Diese Übung ist Teil des Kurses
Daten umformen mit pandas
Anleitung zur Übung
- Importiere die Funktion
json_normalize()auspandas. - Normalisiere das in
moviesenthaltene JSON. Trenne die aus verschachtelten Einträgen erzeugten Namen mit einem Unterstrich. - Forme das resultierende DataFrame
movies_normvon Wide in Long um und verwende die Spaltendirectorundproducerals eindeutige Indizes. Benenne die aus den Spaltenmovieserstellte neue Variable mit dem Präfixfeatures, getrennt durch einen Unterstrich und mit einem Suffix, das aus Wörtern besteht.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import the json_normalize function
____
# Normalize movies and separate the new columns with an underscore
movies_norm = ____(____, sep=____)
# Reshape using director and producer as index, create movies from column starting from features
movies_long = pd.____(____, stubnames=____,
i=____, j=____,
sep=____, suffix=____)
# Print movies_long
print(movies_long)