Vecteurs de mots dans le vocabulaire de spaCy
Les vecteurs de mots permettent à un ordinateur de « comprendre » les mots. Dans cet exercice, vous allez vous entraîner à extraire les vecteurs de mots pour une liste donnée de termes.
Une liste de mots est fournie sous le nom words. Le modèle en_core_web_md est déjà importé et disponible sous nlp.
Le vocabulaire du modèle en_core_web_md contient 20 000 mots. Si un mot n’existe pas dans le vocabulaire, vous ne pourrez pas extraire son vecteur. Pour simplifier, on s’assure ici que tous les mots donnés existent dans le vocabulaire de ce modèle.
Cet exercice fait partie du cours
Traitement du langage naturel avec spaCy
Instructions
- Extrayez les ID de tous les
wordsfournis et stockez-les dans une listeids. - Pour chaque ID de
ids, stockez les dix premiers éléments du vecteur de mots dans la listeword_vectors. - Affichez les dix premiers éléments du premier vecteur de
word_vectors.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
words = ["like", "love"]
# IDs of all the given words
ids = [nlp.____.____[w] for w in words]
# Store the first ten elements of the word vectors for each word
word_vectors = [nlp.____.____[i][:10] for i in ids]
# Print the first ten elements of the first word vector
print(____[0])