Wortvektoren im spaCy-Vokabular
Der Zweck von Wortvektoren ist es, einem Computer das Verstehen von Wörtern zu ermöglichen. In dieser Übung übst du, Wortvektoren für eine gegebene Liste von Wörtern zu extrahieren.
Eine Wortliste ist als words vorgegeben. Das Modell en_core_web_md ist bereits importiert und als nlp verfügbar.
Das Vokabular des Modells en_core_web_md enthält 20.000 Wörter. Wenn ein Wort nicht im Vokabular enthalten ist, kannst du den zugehörigen Wortvektor nicht extrahieren. In dieser Übung ist der Einfachheit halber sichergestellt, dass alle angegebenen Wörter im Vokabular dieses Modells vorhanden sind.
Diese Übung ist Teil des Kurses
Natural Language Processing mit spaCy
Anleitung zur Übung
- Extrahiere die IDs aller gegebenen
wordsund speichere sie in einer Listeids. - Speichere für jede ID aus
idsdie ersten zehn Elemente des Wortvektors in der Listeword_vectors. - Gib die ersten zehn Elemente des ersten Wortvektors aus
word_vectorsaus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
words = ["like", "love"]
# IDs of all the given words
ids = [nlp.____.____[w] for w in words]
# Store the first ten elements of the word vectors for each word
word_vectors = [nlp.____.____[i][:10] for i in ids]
# Print the first ten elements of the first word vector
print(____[0])