Désambiguïsation du sens des mots avec spaCy
La WSD (word-sense disambiguation) est un problème classique qui consiste à déterminer dans quel sens un mot est utilisé dans une phrase. Identifier le sens d’un mot peut être crucial pour les moteurs de recherche, la traduction automatique et les systèmes de questions-réponses. Dans cet exercice, vous allez vous entraîner à utiliser l’étiquetage morpho-syntaxique (POS tagging) pour la désambiguïsation du sens.
Vous disposez de deux phrases contenant le mot jam, chacune avec un sens différent, et vous devez identifier les étiquettes POS pour vous aider à déterminer le sens correspondant du mot dans une phrase donnée.
Les deux phrases sont disponibles dans la liste texts. Le modèle en_core_web_sm est déjà chargé et accessible sous le nom nlp.
Cet exercice fait partie du cours
Traitement du langage naturel avec spaCy
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
texts = ["This device is used to jam the signal.",
"I am stuck in a traffic jam"]
# Create a list of Doc containers in the texts list
documents = [____ for t in texts]
# Print a token's text and POS tag if the word jam is in the token's text
for i, doc in enumerate(documents):
print(f"Sentence {i+1}: ", [(____, ____) for token in doc if "jam" in token.text], "\n")