ComenzarEmpieza gratis

Palabras similares en un vocabulario

Encontrar términos semánticamente similares tiene varias aplicaciones en la recuperación de información. En este ejercicio, practicarás cómo encontrar el término más similar semánticamente a la palabra computer dentro del vocabulario del modelo en_core_web_md.

El vector de la palabra computer ya se ha extraído y está guardado como word_vector. El modelo en_core_web_md ya está cargado como nlp, y el paquete NumPy está cargado como np.

Puedes usar la función .most_similar() del objeto nlp.vocab.vectors para encontrar los términos más similares semánticamente. Si indexas la salida de esta función con [0][0], obtendrás los IDs de las palabras de los términos similares. nlp.vocab.strings[<a given word>] se puede usar para obtener el ID de una palabra dada y, de forma similar, puede devolver la palabra asociada a un ID dado.

Este ejercicio forma parte del curso

Procesamiento del Lenguaje Natural con spaCy

Ver curso

Instrucciones del ejercicio

  • Encuentra el término más similar semánticamente del vocabulario de en_core_web_md.
  • Obtén la lista de palabras similares a partir de los IDs de palabra de los términos similares.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Find the most similar word to the word computer
most_similar_words = nlp.vocab.vectors.____(np.asarray([____]), n = 1)

# Find the list of similar words given the word IDs
words = [nlp.____.____[____] for w in most_similar_words[0][0]]
print(words)
Editar y ejecutar código