Vectores de palabras en el vocabulario de spaCy
El objetivo de los vectores de palabras es permitir que un ordenador entienda las palabras. En este ejercicio, practicarás cómo extraer vectores de palabras para una lista dada.
Se ha compilado una lista de palabras en words. El modelo en_core_web_md ya está importado y disponible como nlp.
El vocabulario del modelo en_core_web_md contiene 20.000 palabras. Si una palabra no existe en el vocabulario, no podrás extraer su vector correspondiente. En este ejercicio, para simplificar, se garantiza que todas las palabras dadas existen en el vocabulario de este modelo.
Este ejercicio forma parte del curso
Procesamiento del Lenguaje Natural con spaCy
Instrucciones del ejercicio
- Extrae los IDs de todas las
wordsdadas y guárdalos en una listaids. - Para cada ID de
ids, guarda los primeros diez elementos del vector de la palabra en la listaword_vectors. - Imprime los primeros diez elementos del primer vector de palabra de
word_vectors.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
words = ["like", "love"]
# IDs of all the given words
ids = [nlp.____.____[w] for w in words]
# Store the first ten elements of the word vectors for each word
word_vectors = [nlp.____.____[i][:10] for i in ids]
# Print the first ten elements of the first word vector
print(____[0])