Elementair, beste Watson!
Het is vrijdag en je staat op het punt je boekproject af te ronden. Voor je laatste taak analyseer je gegevens over de boeken van Arthur Conan Doyle.
Je merkt dat je gegevensset, books_sh, van vorm moet veranderen. Je ziet dat er kolommen zijn die je kunt groeperen met een voorvoegsel. Je bepaalt welke kolommen je als unieke ID's gaat gebruiken. Sommige van deze kolommen bevatten echter strings. Die moeten eerst bewerkt worden voordat je een wide-to-long-transformatie toepast. Je besluit dat een aantal strings gesplitst moet worden om de DataFrame schoner te maken.
De books_sh-gegevensset is beschikbaar. Deze bevat de titel en gegevens over version, number_pages en number_ratings van elk boek.
Deze oefening maakt deel uit van de cursus
Data herstructureren met pandas
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Split main_title by a colon and assign it to two columns named title and subtitle
books_sh[['title', 'subtitle']] = ____[____].____.____(____, ____=____)
# Print books_sh
print(books_sh)