CommencerCommencer gratuitement

Vocabulaire spaCy

Les word vectors, ou « embeddings » de mots, sont des représentations numériques qui permettent aux ordinateurs d’effectuer des tâches complexes à partir de données textuelles. Les word vectors sont présents dans de nombreux modèles spaCy, mais certains modèles n’en disposent pas.

Dans cet exercice, vous allez vous entraîner à accéder aux informations de vocabulaire de spaCy. Certaines métadonnées sur les word vectors sont stockées dans chaque modèle spaCy. Vous pouvez y accéder pour en savoir plus sur la taille du vocabulaire, la dimension des vecteurs, etc.

Le package spaCy est déjà importé. Dans les métadonnées d’un modèle spaCy, le nombre de mots est stocké dans un élément avec la clé "vectors" et la dimension des word vectors est stockée dans un élément avec la clé "width".

Cet exercice fait partie du cours

Traitement du langage naturel avec spaCy

Afficher le cours

Instructions

  • Chargez le modèle en_core_web_md.
  • Affichez le nombre de mots dans le vocabulaire du modèle en_core_web_md.
  • Affichez la dimension des word vectors dans le modèle en_core_web_md.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Load the en_core_web_md model
md_nlp = ____

# Print the number of words in the model's vocabulary
print("Number of words: ", md_nlp.____["vectors"]["vectors"], "\n")

# Print the dimensions of word vectors in en_core_web_md model
print("Dimension of word vectors: ", md_nlp.____["vectors"]["width"])
Modifier et exécuter le code