Doc-Container in spaCy
Der erste Schritt einer spaCy-Textverarbeitungspipeline besteht darin, einen gegebenen Text-String in einen Doc-Container umzuwandeln, der den verarbeiteten Text speichert. In dieser Übung lädst du ein spaCy-Modell, erstellst ein nlp()-Objekt, erzeugst einen Doc-Container und verarbeitest einen text-String, der für dich bereitsteht.
Das Modell en_core_web_sm ist bereits heruntergeladen.
Diese Übung ist Teil des Kurses
Natural Language Processing mit spaCy
Anleitung zur Übung
- Lade
en_core_web_smund erstelle einnlp-Objekt. - Erzeuge einen
doc-Container aus demtext-String. - Erstelle eine Liste, die den Text jedes Tokens im
doc-Container enthält.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Load en_core_web_sm and create an nlp object
nlp = spacy.____(____)
# Create a Doc container for the text object
doc = ____(____)
# Create a list containing the text of each token in the Doc container
print([____ for ____ in ____])