Doc-Container in spaCy
Der erste Schritt einer spaCy-Textverarbeitungspipeline besteht darin, einen gegebenen Text-String in einen Doc-Container umzuwandeln, der den verarbeiteten Text speichert. In dieser Übung lädst du ein spaCy-Modell, erstellst ein nlp()-Objekt, erzeugst einen Doc-Container und verarbeitest einen text-String, der für dich bereitsteht.
Das Modell en_core_web_sm ist bereits heruntergeladen.
Diese Übung ist Teil des Kurses
<Kurs>Natural Language Processing mit spaCy</Kurs>Übungsanweisungen
- Lade
en_core_web_smund erstelle einnlp-Objekt. - Erzeuge einen
doc-Container aus demtext-String. - Erstelle eine Liste, die den Text jedes Tokens im
doc-Container enthält.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Load en_core_web_sm and create an nlp object
nlp = spacy.____(____)
# Create a Doc container for the text object
doc = ____(____)
# Create a list containing the text of each token in the Doc container
print([____ for ____ in ____])