ComenzarEmpieza gratis

Vocabulario de spaCy

Los word vectors, o word embeddings, son representaciones numéricas de palabras que permiten a los ordenadores realizar tareas complejas con datos de texto. Muchos modelos de spaCy incluyen word vectors; sin embargo, algunos no los tienen.

En este ejercicio, practicarás cómo acceder a la información del vocabulario de spaCy. Cada modelo de spaCy almacena metadatos sobre los word vectors. Puedes consultar esta información para saber más sobre el tamaño del vocabulario, las dimensiones de los word vectors, etc.

El paquete spaCy ya está importado para que lo uses. En los metadatos de un modelo de spaCy, el número de palabras se guarda como un elemento con la clave "vectors" y la dimensión de los word vectors se guarda como un elemento con la clave "width".

Este ejercicio forma parte del curso

Procesamiento del Lenguaje Natural con spaCy

Ver curso

Instrucciones del ejercicio

  • Carga el modelo en_core_web_md.
  • Imprime el número de palabras en el vocabulario del modelo en_core_web_md.
  • Imprime las dimensiones de los word vectors en el modelo en_core_web_md.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Load the en_core_web_md model
md_nlp = ____

# Print the number of words in the model's vocabulary
print("Number of words: ", md_nlp.____["vectors"]["vectors"], "\n")

# Print the dimensions of word vectors in en_core_web_md model
print("Dimension of word vectors: ", md_nlp.____["vectors"]["width"])
Editar y ejecutar código