CommencerCommencer gratuitement

Suppression des titres et prise des noms

Lors de la collecte des métadonnées des répondants à l'enquête dans le DataFrame airlines, le nom complet des répondants a été enregistré dans la colonne full_name. Cependant, après un examen plus approfondi, vous avez constaté que de nombreux noms différents sont précédés de titres honorifiques tels que "Dr.", "Mr.", "Ms." et "Miss".

Votre objectif final est de créer deux nouvelles colonnes nommées first_name et last_name, contenant respectivement les prénoms et les noms de famille des répondants. Avant de procéder, il est nécessaire de supprimer les titres.

Le DataFrame airlines se trouve dans votre environnement, aux côtés de pandas sous le nom pd.

Cet exercice fait partie du cours

Nettoyage des données en Python

Afficher le cours

Instructions

  • Supprimez "Dr.", "Mr.", "Miss" et "Ms." de full_name en les remplaçant par une chaîne vide "" dans cet ordre.
  • Exécutez l'instruction assert en utilisant .str.contains() qui vérifie si full_name contient toujours des titres.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Replace "Dr." with empty string ""
airlines['full_name'] = airlines['full_name'].____.____("____","")

# Replace "Mr." with empty string ""
airlines['full_name'] = ____

# Replace "Miss" with empty string ""
____

# Replace "Ms." with empty string ""
____

# Assert that full_name has no honorifics
assert airlines['full_name'].str.contains('Ms.|Mr.|Miss|Dr.').any() == False
Modifier et exécuter le code