NER mit spaCy
Named Entity Recognition (NER) hilft dir, die Schlüsselelemente eines Dokuments leicht zu erkennen, zum Beispiel Namen von Personen und Orten. Das hilft dabei, unstrukturierte Daten zu ordnen und wichtige Informationen zu erkennen – entscheidend, wenn du mit großen Datensätzen arbeitest. In dieser Übung trainierst du die Named Entity Recognition.
en_core_web_sm wurde bereits als nlp geladen. Drei Kommentare aus dem Airline Travel Information System (ATIS)-Datensatz wurden dir in einer Liste namens texts bereitgestellt.
Diese Übung ist Teil des Kurses
Natural Language Processing mit spaCy
Anleitung zur Übung
- Erstelle
documents, eine Liste allerDoc-Container für jeden Text intexts, mithilfe von List Comprehension. - Gib für jeden
doc-Container zu jeder Entität den Text und das zugehörige Label aus, indem du überdoc.entsiterierst. - Gib den Text des sechsten Tokens sowie den Entitätstyp des zweiten
Doc-Containers aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Compile a list of all Doc containers of texts
documents = [____ for text in texts]
# Print the entity text and label for the entities in each document
for doc in documents:
print([(____, ____) for ent in ____])
# Print the 6th token's text and entity type of the second document
print("\nText:", documents[1][5].____, "| Entity type: ", documents[1][5].____)