Tijd om te lezen, Katniss!
Het is bijna tijd om je werkdag af te ronden. Maar eerst wil je voor de lol nog een analyse doen. Je gaat nog een boeken-gegevensset analyseren, dit keer van de Hunger Games-reeks.
Je hebt de gegevensset books_hunger bekeken voordat je deze omvormde, maar er klopte iets niet. De index van de DataFrame bevat de titel van de boeken. Je weet dat je het zo niet kunt reshapen. Als je dat wel doet, verlies je waardevolle data — de titel — dus moet je wat aanpassen voordat je de DataFrame transformeert.
De gegevensset books_hunger is voor je beschikbaar. Deze bevat de title en gegevens over de language, publication date, publication number en page number van elk boek.
Deze oefening maakt deel uit van de cursus
Data herstructureren met pandas
Oefeninstructies
- Pas de DataFrame
books_hungeraan door de index te resetten zonder deze te droppen. - Reshape
books_hungervan breed naar lang formaat. Gebruik de kolommentitleenlanguageals unieke indexen. Noemfeaturede nieuwe variabele die wordt gemaakt uit de kolommen die beginnen metpublicationenpage. Die kolommen zijn gescheiden door een spatie en eindigen op een woord.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Modify books_hunger by resetting the index without dropping it
books_hunger.____(____=____, inplace=____)
# Reshape using title and language as index, feature as new name, publication and page as prefix separated by space and ending in a word
publication_features = pd.wide_to_long(____,
____=____,
____=____,
____=____,
____=____,
____=____)
# Print publication_features
print(publication_features)