Zeit zum Lesen, Katniss!
Es ist fast Zeit, den Arbeitstag zu beenden. Aber zuerst möchtest du zum Spaß noch eine kleine Analyse machen. Du analysierst ein weiteres Buch-Dataset, diesmal zur Hunger Games-Reihe.
Du hast das Dataset books_hunger vor der Umformung untersucht, aber etwas stimmte nicht. Der Index des DataFrames enthält die Titel der Bücher. Du weißt, dass du es in diesem Format nicht umformen kannst. Tust du es doch, gehen wichtige Daten verloren – nämlich der Titel. Also musst du vor der Transformation ein paar Änderungen vornehmen.
Das Dataset books_hunger steht dir zur Verfügung. Es enthält den title sowie Daten zu language, publication date, publication number und page number jedes Buchs.
Diese Übung ist Teil des Kurses
Daten umformen mit pandas
Anleitung zur Übung
- Ändere den DataFrame
books_hunger, indem du den Index zurücksetzt, ohne ihn zu verwerfen. - Forme
books_hungervon Wide- in Long-Format um. Verwende die Spaltentitleundlanguageals eindeutige Indizes. Nennefeaturedie neue Variable, die aus den Spalten erstellt wird, die mitpublicationundpagebeginnen. Diese Spalten sind durch ein Leerzeichen getrennt und enden mit einem Wort.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Modify books_hunger by resetting the index without dropping it
books_hunger.____(____=____, inplace=____)
# Reshape using title and language as index, feature as new name, publication and page as prefix separated by space and ending in a word
publication_features = pd.wide_to_long(____,
____=____,
____=____,
____=____,
____=____,
____=____)
# Print publication_features
print(publication_features)