IniziaInizia gratis

Rimuovere i titoli e prendere i nomi

Durante la raccolta dei metadati dei rispondenti al sondaggio nel DataFrame airlines, il nome completo dei rispondenti è stato salvato nella colonna full_name. Tuttavia, a un’analisi più attenta, hai notato che molti nomi sono preceduti da onorificenze come "Dr.", "Mr.", "Ms." e "Miss".

Il tuo obiettivo finale è creare due nuove colonne chiamate first_name e last_name, che contengano rispettivamente nome e cognome dei rispondenti. Prima però, devi rimuovere le onorificenze.

Il DataFrame airlines è nel tuo ambiente, insieme a pandas come pd.

Questo esercizio fa parte del corso

Pulizia dei dati in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Rimuovi "Dr.", "Mr.", "Miss" e "Ms." da full_name sostituendoli con una stringa vuota "" in quell’ordine.
  • Esegui l’istruzione assert usando .str.contains() che verifica se full_name contiene ancora una delle onorificenze.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Replace "Dr." with empty string ""
airlines['full_name'] = airlines['full_name'].____.____("____","")

# Replace "Mr." with empty string ""
airlines['full_name'] = ____

# Replace "Miss" with empty string ""
____

# Replace "Ms." with empty string ""
____

# Assert that full_name has no honorifics
assert airlines['full_name'].str.contains('Ms.|Mr.|Miss|Dr.').any() == False
Modifica ed esegui il codice