Suppression des titres et prise des noms
Lors de la collecte des métadonnées des répondants à l'enquête dans le DataFrame airlines, le nom complet des répondants a été enregistré dans la colonne full_name. Cependant, après un examen plus approfondi, vous avez constaté que de nombreux noms différents sont précédés de titres honorifiques tels que "Dr.", "Mr.", "Ms." et "Miss".
Votre objectif final est de créer deux nouvelles colonnes nommées first_name et last_name, contenant respectivement les prénoms et les noms de famille des répondants. Avant de procéder, il est nécessaire de supprimer les titres.
Le DataFrame airlines se trouve dans votre environnement, aux côtés de pandas sous le nom pd.
Cet exercice fait partie du cours
Nettoyage des données en Python
Instructions
- Supprimez
"Dr.","Mr.","Miss"et"Ms."defull_nameen les remplaçant par une chaîne vide""dans cet ordre. - Exécutez l'instruction
asserten utilisant.str.contains()qui vérifie sifull_namecontient toujours des titres.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Replace "Dr." with empty string ""
airlines['full_name'] = airlines['full_name'].____.____("____","")
# Replace "Mr." with empty string ""
airlines['full_name'] = ____
# Replace "Miss" with empty string ""
____
# Replace "Ms." with empty string ""
____
# Assert that full_name has no honorifics
assert airlines['full_name'].str.contains('Ms.|Mr.|Miss|Dr.').any() == False