Soortgelijke woorden in een vocabulaire
Semantisch vergelijkbare termen vinden heeft diverse toepassingen in information retrieval. In deze oefening ga je het meest semantisch vergelijkbare woord bij computer zoeken in de vocabulaire van het en_core_web_md-model.
De woordvector van computer is al geëxtraheerd en opgeslagen als word_vector. Het en_core_web_md-model is al geladen als nlp, en het NumPy-pakket is geladen als np.
Je kunt de functie .most_similar() van het object nlp.vocab.vectors gebruiken om de meest semantisch vergelijkbare termen te vinden. Met [0][0] indexeer je de uitvoer van deze functie om de woord-ID’s van de semantisch vergelijkbare termen te krijgen. nlp.vocab.strings[<a given word>] kun je gebruiken om de woord-ID van een gegeven woord te vinden en op vergelijkbare wijze het woord op te halen dat bij een gegeven woord-ID hoort.
Deze oefening maakt deel uit van de cursus
Natural Language Processing met spaCy
Oefeninstructies
- Zoek de meest semantisch vergelijkbare term in de
en_core_web_md-vocabulaire. - Zoek de lijst met soortgelijke woorden op basis van de woord-ID’s van de vergelijkbare termen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Find the most similar word to the word computer
most_similar_words = nlp.vocab.vectors.____(np.asarray([____]), n = 1)
# Find the list of similar words given the word IDs
words = [nlp.____.____[____] for w in most_similar_words[0][0]]
print(words)