LoslegenKostenlos loslegen

Ähnliche Wörter in einem Vokabular

Das Auffinden semantisch ähnlicher Begriffe hat viele Anwendungen im Information Retrieval. In dieser Übung übst du, den semantisch ähnlichsten Begriff zum Wort computer aus dem Vokabular des Modells en_core_web_md zu finden.

Der Wortvektor zu computer wurde bereits extrahiert und als word_vector gespeichert. Das Modell en_core_web_md ist als nlp geladen und das NumPy-Paket als np.

Du kannst die Funktion .most_similar() des Objekts nlp.vocab.vectors verwenden, um die semantisch ähnlichsten Begriffe zu finden. Das Indexieren der Ausgabe dieser Funktion mit [0][0] liefert die Wort-IDs der semantisch ähnlichen Begriffe. nlp.vocab.strings[<a given word>] kann verwendet werden, um die Wort-ID eines gegebenen Wortes zu finden; entsprechend kann damit auch das Wort zu einer gegebenen Wort-ID ermittelt werden.

Diese Übung ist Teil des Kurses

Natural Language Processing mit spaCy

Kurs anzeigen

Anleitung zur Übung

  • Finde den semantisch ähnlichsten Begriff aus dem en_core_web_md-Vokabular.
  • Ermittle die Liste ähnlicher Wörter anhand der Wort-IDs der ähnlichen Begriffe.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Find the most similar word to the word computer
most_similar_words = nlp.vocab.vectors.____(np.asarray([____]), n = 1)

# Find the list of similar words given the word IDs
words = [nlp.____.____[____] for w in most_similar_words[0][0]]
print(words)
Code bearbeiten und ausführen