CommencerCommencer gratuitement

Suppression des titres et prise des noms

Lors de la collecte des métadonnées des répondants à l'enquête dans le DataFrame « airlines », le nom complet des répondants a été enregistré dans la colonne « full_name ». Cependant, après un examen plus approfondi, vous avez constaté que de nombreux noms différents sont précédés de titres honorifiques tels que « "Dr." », « "Mr." », « "Ms." » et « "Miss" ».

Votre objectif final est de créer deux nouvelles colonnes nommées « first_name » et « last_name », contenant respectivement les prénoms et les noms de famille des répondants. Avant de procéder, il est nécessaire de supprimer les formules de politesse.

Le DataFrame airlines se trouve dans votre environnement, aux côtés de pandas sous le nom pd.

Cet exercice fait partie du cours

Nettoyage des données en Python

Afficher le cours

Instructions

  • Veuillez supprimer "Dr.", "Mr.", "Miss" et "Ms." de full_name en les remplaçant par une chaîne vide "" dans cet ordre.
  • Exécutez l'instruction assert en utilisant .str.contains() qui vérifie si full_name contient toujours des titres honorifiques.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Replace "Dr." with empty string ""
airlines['full_name'] = airlines['full_name'].____.____("____","")

# Replace "Mr." with empty string ""
airlines['full_name'] = ____

# Replace "Miss" with empty string ""
____

# Replace "Ms." with empty string ""
____

# Assert that full_name has no honorifics
assert airlines['full_name'].str.contains('Ms.|Mr.|Miss|Dr.').any() == False
Modifier et exécuter le code