Titel entfernen und Namen erfassen
Bei der Erfassung der Metadaten der Befragten im DataFrame airlines
wurde der vollständige Name der Befragten in der Spalte full_name
gespeichert. Bei genauerem Hinsehen hast du jedoch festgestellt, dass vielen der verschiedenen Namen Ehrentitel wie "Dr."
, "Mr."
, "Ms."
und "Miss"
vorangestellt sind.
Dein Ziel ist es, zwei neue Spalten namens first_name
und last_name
zu erstellen, die jeweils den Vor- und Nachnamen der Befragten enthalten. Bevor du das tust, musst du jedoch die Ehrentitel entfernen.
Der DataFrame airlines
befindet sich in deiner Umgebung, neben pandas
als pd.
.
Diese Übung ist Teil des Kurses
Datenbereinigung in Python
Anleitung zur Übung
- Entferne
"Dr."
,"Mr."
,"Miss"
und"Ms."
ausfull_name
, indem du sie in dieser Reihenfolge durch die leere Zeichenkette""
ersetzt. - Führe die Anweisung
assert
mit.str.contains()
aus, die prüft, obfull_name
noch einen der Ehrentitel enthält.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Replace "Dr." with empty string ""
airlines['full_name'] = airlines['full_name'].____.____("____","")
# Replace "Mr." with empty string ""
airlines['full_name'] = ____
# Replace "Miss" with empty string ""
____
# Replace "Ms." with empty string ""
____
# Assert that full_name has no honorifics
assert airlines['full_name'].str.contains('Ms.|Mr.|Miss|Dr.').any() == False