Parole simili in un vocabolario
Trovare termini semanticamente simili ha diverse applicazioni nel recupero di informazioni. In questo esercizio, ti allenerai a trovare il termine più semanticamente simile alla parola computer dal vocabolario del modello en_core_web_md.
Il word vector di computer è già stato estratto e salvato come word_vector. Il modello en_core_web_md è già caricato come nlp, e il pacchetto NumPy è caricato come np.
Puoi usare la funzione .most_similar() dell’oggetto nlp.vocab.vectors per trovare i termini più semanticamente simili. Usare [0][0] per indicizzare l’output di questa funzione restituirà gli ID delle parole dei termini semanticamente simili. nlp.vocab.strings[<a given word>] può essere usato per trovare l’ID di una parola data e, in modo analogo, può restituire la parola associata a un dato ID di parola.
Questo esercizio fa parte del corso
Natural Language Processing con spaCy
Istruzioni dell'esercizio
- Trova il termine più semanticamente simile dal vocabolario
en_core_web_md. - Trova l’elenco delle parole simili a partire dagli ID dei termini simili.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Find the most similar word to the word computer
most_similar_words = nlp.vocab.vectors.____(np.asarray([____]), n = 1)
# Find the list of similar words given the word IDs
words = [nlp.____.____[____] for w in most_similar_words[0][0]]
print(words)