LoslegenKostenlos loslegen

NER mit spaCy

Named Entity Recognition (NER) hilft dir, die Schlüsselelemente eines Dokuments leicht zu erkennen, zum Beispiel Namen von Personen und Orten. Das hilft dabei, unstrukturierte Daten zu ordnen und wichtige Informationen zu erkennen – entscheidend, wenn du mit großen Datensätzen arbeitest. In dieser Übung trainierst du die Named Entity Recognition.

en_core_web_sm wurde bereits als nlp geladen. Drei Kommentare aus dem Airline Travel Information System (ATIS)-Datensatz wurden dir in einer Liste namens texts bereitgestellt.

Diese Übung ist Teil des Kurses

Natural Language Processing mit spaCy

Kurs anzeigen

Anleitung zur Übung

  • Erstelle documents, eine Liste aller Doc-Container für jeden Text in texts, mithilfe von List Comprehension.
  • Gib für jeden doc-Container zu jeder Entität den Text und das zugehörige Label aus, indem du über doc.ents iterierst.
  • Gib den Text des sechsten Tokens sowie den Entitätstyp des zweiten Doc-Containers aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Compile a list of all Doc containers of texts
documents = [____ for text in texts]

# Print the entity text and label for the entities in each document
for doc in documents:
    print([(____, ____) for ent in ____])
    
# Print the 6th token's text and entity type of the second document
print("\nText:", documents[1][5].____, "| Entity type: ", documents[1][5].____)
Code bearbeiten und ausführen