Titels verwijderen en namen overhouden
Bij het verzamelen van metadata van enquêterespondenten in de airlines-DataFrame is de volledige naam van respondenten opgeslagen in de kolom full_name. Maar bij nader inzien bleek dat veel namen voorafgegaan worden door aanspreektitels zoals "Dr.", "Mr.", "Ms." en "Miss".
Je uiteindelijke doel is om twee nieuwe kolommen te maken, first_name en last_name, met respectievelijk de voor- en achternaam van respondenten. Voordat je dat doet, moet je echter eerst de aanspreektitels verwijderen.
De DataFrame airlines staat in je omgeving, samen met pandas als pd.
Deze oefening maakt deel uit van de cursus
Data opschonen in Python
Oefeninstructies
- Verwijder
"Dr.","Mr.","Miss"en"Ms."uitfull_namedoor ze in die volgorde te vervangen door een lege string"". - Voer de
assert-instructie uit met.str.contains()die test offull_namenog een van de aanspreektitels bevat.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Replace "Dr." with empty string ""
airlines['full_name'] = airlines['full_name'].____.____("____","")
# Replace "Mr." with empty string ""
airlines['full_name'] = ____
# Replace "Miss" with empty string ""
____
# Replace "Ms." with empty string ""
____
# Assert that full_name has no honorifics
assert airlines['full_name'].str.contains('Ms.|Mr.|Miss|Dr.').any() == False