Suppression des titres et prise des noms
Lors de la collecte des métadonnées des répondants à l'enquête dans le DataFrame « airlines
», le nom complet des répondants a été enregistré dans la colonne « full_name
». Cependant, après un examen plus approfondi, vous avez constaté que de nombreux noms différents sont précédés de titres honorifiques tels que « "Dr."
», « "Mr."
», « "Ms."
» et « "Miss"
».
Votre objectif final est de créer deux nouvelles colonnes nommées « first_name
» et « last_name
», contenant respectivement les prénoms et les noms de famille des répondants. Avant de procéder, il est nécessaire de supprimer les formules de politesse.
Le DataFrame airlines
se trouve dans votre environnement, aux côtés de pandas
sous le nom pd.
Cet exercice fait partie du cours
Nettoyage des données en Python
Instructions
- Veuillez supprimer
"Dr."
,"Mr."
,"Miss"
et"Ms."
defull_name
en les remplaçant par une chaîne vide""
dans cet ordre. - Exécutez l'instruction
assert
en utilisant.str.contains()
qui vérifie sifull_name
contient toujours des titres honorifiques.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Replace "Dr." with empty string ""
airlines['full_name'] = airlines['full_name'].____.____("____","")
# Replace "Mr." with empty string ""
airlines['full_name'] = ____
# Replace "Miss" with empty string ""
____
# Replace "Ms." with empty string ""
____
# Assert that full_name has no honorifics
assert airlines['full_name'].str.contains('Ms.|Mr.|Miss|Dr.').any() == False