Verschachtelte Filme

Du bist neugierig auf einen movies-Datensatz, der schon seit einiger Zeit auf deinem Computer liegt und Daten zu verschiedenen Filmen enthält. Du möchtest diese Daten analysieren, stellst aber fest, dass sie im verschachtelten JSON-Format vorliegen.

Um ihn in ein DataFrame einzulesen, musst du die Funktion verwenden, die du gerade gelernt hast. Danach formst du das resultierende DataFrame um, damit es leichter zu bearbeiten ist.

Das semi-strukturierte JSON namens movies steht dir zur Verfügung. Schau es dir unbedingt in der Konsole an!

Diese Übung ist Teil des Kurses

Daten umformen mit pandas

Kurs anzeigen

Anleitung zur Übung

Importiere die Funktion json_normalize() aus pandas.
Normalisiere das in movies enthaltene JSON. Trenne die aus verschachtelten Einträgen erzeugten Namen mit einem Unterstrich.
Forme das resultierende DataFrame movies_norm von Wide in Long um und verwende die Spalten director und producer als eindeutige Indizes. Benenne die aus den Spalten movies erstellte neue Variable mit dem Präfix features, getrennt durch einen Unterstrich und mit einem Suffix, das aus Wörtern besteht.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import the json_normalize function
____

# Normalize movies and separate the new columns with an underscore 
movies_norm = ____(____, sep=____)

# Reshape using director and producer as index, create movies from column starting from features
movies_long = pd.____(____, stubnames=____, 
                      i=____, j=____, 
                      sep=____, suffix=____)

# Print movies_long
print(movies_long)

Code bearbeiten und ausführen