Tijd om te lezen, Katniss!

Het is bijna tijd om je werkdag af te ronden. Maar eerst wil je voor de lol nog een analyse doen. Je gaat nog een boeken-gegevensset analyseren, dit keer van de Hunger Games-reeks.

Je hebt de gegevensset books_hunger bekeken voordat je deze omvormde, maar er klopte iets niet. De index van de DataFrame bevat de titel van de boeken. Je weet dat je het zo niet kunt reshapen. Als je dat wel doet, verlies je waardevolle data — de titel — dus moet je wat aanpassen voordat je de DataFrame transformeert.

De gegevensset books_hunger is voor je beschikbaar. Deze bevat de title en gegevens over de language, publication date, publication number en page number van elk boek.

Deze oefening maakt deel uit van de cursus

Data herstructureren met pandas

Bekijk cursus

Oefeninstructies

Pas de DataFrame books_hunger aan door de index te resetten zonder deze te droppen.
Reshape books_hunger van breed naar lang formaat. Gebruik de kolommen title en language als unieke indexen. Noem feature de nieuwe variabele die wordt gemaakt uit de kolommen die beginnen met publication en page. Die kolommen zijn gescheiden door een spatie en eindigen op een woord.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Modify books_hunger by resetting the index without dropping it
books_hunger.____(____=____, inplace=____)

# Reshape using title and language as index, feature as new name, publication and page as prefix separated by space and ending in a word
publication_features = pd.wide_to_long(____, 
                                       ____=____, 
                                       ____=____, 
                                       ____=____, 
                                       ____=____, 
                                       ____=____)

# Print publication_features
print(publication_features)

Code bewerken en uitvoeren