Elementair, beste Watson!

Het is vrijdag en je staat op het punt je boekproject af te ronden. Voor je laatste taak analyseer je gegevens over de boeken van Arthur Conan Doyle.

Je merkt dat je gegevensset, books_sh, van vorm moet veranderen. Je ziet dat er kolommen zijn die je kunt groeperen met een voorvoegsel. Je bepaalt welke kolommen je als unieke ID's gaat gebruiken. Sommige van deze kolommen bevatten echter strings. Die moeten eerst bewerkt worden voordat je een wide-to-long-transformatie toepast. Je besluit dat een aantal strings gesplitst moet worden om de DataFrame schoner te maken.

De books_sh-gegevensset is beschikbaar. Deze bevat de titel en gegevens over version, number_pages en number_ratings van elk boek.

Deze oefening maakt deel uit van de cursus

Data herstructureren met pandas

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Split main_title by a colon and assign it to two columns named title and subtitle 
books_sh[['title', 'subtitle']] = ____[____].____.____(____, ____=____)

# Print books_sh
print(books_sh)

Code bewerken en uitvoeren