Rimuovere i titoli e prendere i nomi
Durante la raccolta dei metadati dei rispondenti al sondaggio nel DataFrame airlines, il nome completo dei rispondenti è stato salvato nella colonna full_name. Tuttavia, a un’analisi più attenta, hai notato che molti nomi sono preceduti da onorificenze come "Dr.", "Mr.", "Ms." e "Miss".
Il tuo obiettivo finale è creare due nuove colonne chiamate first_name e last_name, che contengano rispettivamente nome e cognome dei rispondenti. Prima però, devi rimuovere le onorificenze.
Il DataFrame airlines è nel tuo ambiente, insieme a pandas come pd.
Questo esercizio fa parte del corso
Pulizia dei dati in Python
Istruzioni dell'esercizio
- Rimuovi
"Dr.","Mr.","Miss"e"Ms."dafull_namesostituendoli con una stringa vuota""in quell’ordine. - Esegui l’istruzione
assertusando.str.contains()che verifica sefull_namecontiene ancora una delle onorificenze.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Replace "Dr." with empty string ""
airlines['full_name'] = airlines['full_name'].____.____("____","")
# Replace "Mr." with empty string ""
airlines['full_name'] = ____
# Replace "Miss" with empty string ""
____
# Replace "Ms." with empty string ""
____
# Assert that full_name has no honorifics
assert airlines['full_name'].str.contains('Ms.|Mr.|Miss|Dr.').any() == False