LoslegenKostenlos loslegen

spaCy-Vokabular

Wortvektoren, auch Word Embeddings, sind numerische Repräsentationen von Wörtern, mit denen Computer komplexe Aufgaben anhand von Textdaten ausführen können. Wortvektoren sind Teil vieler spaCy-Modelle, allerdings haben einige Modelle keine Wortvektoren.

In dieser Übung übst du den Zugriff auf Informationen zum spaCy-Vokabular. Einige Metainformationen über Wortvektoren sind in jedem spaCy-Modell gespeichert. Du kannst diese Informationen abrufen, um mehr über die Vokabulargröße, die Dimension der Wortvektoren usw. zu erfahren.

Das Paket spaCy ist bereits importiert. In den Metadaten eines spaCy-Modells ist die Anzahl der Wörter unter dem Schlüssel "vectors" gespeichert und die Dimension der Wortvektoren unter dem Schlüssel "width".

Diese Übung ist Teil des Kurses

Natural Language Processing mit spaCy

Kurs anzeigen

Anleitung zur Übung

  • Lade das Modell en_core_web_md.
  • Gib die Anzahl der Wörter im Vokabular des Modells en_core_web_md aus.
  • Gib die Dimension der Wortvektoren in en_core_web_md aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Load the en_core_web_md model
md_nlp = ____

# Print the number of words in the model's vocabulary
print("Number of words: ", md_nlp.____["vectors"]["vectors"], "\n")

# Print the dimensions of word vectors in en_core_web_md model
print("Dimension of word vectors: ", md_nlp.____["vectors"]["width"])
Code bearbeiten und ausführen