CommencerCommencer gratuitement

RegEx en Python

L’extraction d’informations par règles est utile pour de nombreuses tâches de NLP. Certains types d’entités, comme les dates ou les numéros de téléphone, ont des formats distincts qui peuvent être reconnus par un ensemble de règles, sans entraîner de modèle. Dans cet exercice, vous allez pratiquer l’utilisation du module re pour les expressions régulières. L’objectif est de trouver des numéros de téléphone dans un text donné.

Le module re est déjà importé pour vous. Vous pouvez utiliser \d pour faire correspondre un motif représentant un métacaractère qui correspond à n’importe quel chiffre de 0 à 9.

Cet exercice fait partie du cours

Traitement du langage naturel avec spaCy

Afficher le cours

Instructions

  • Définissez un motif pour correspondre aux numéros de téléphone au format (111)-111-1111.
  • Trouvez tous les motifs correspondants avec la méthode re.finditer().
  • Pour chaque correspondance, affichez les positions de début et de fin ainsi que la portion correspondante du text donné.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

text = "Our phone number is (425)-123-4567."

# Define a pattern to match phone numbers
pattern = r"\((____){____}\)-(____){____}-(____){____}"

# Find all the matching patterns in the text
phones = re.____(pattern, text)

# Print start and end characters and matching section of the text
for match in phones:
    start_char = match.____
    end_char = match.____
    print("Start character: ", ____, "| End character: ", ____, "| Matching text: ", text[____:____])
Modifier et exécuter le code