Doc-container in spaCy
De eerste stap in een spaCy-tekstverwerkingspijplijn is het omzetten van een gegeven tekststring naar een Doc-container, waarin de verwerkte tekst wordt opgeslagen. In deze oefening ga je een spaCy-model laden, een nlp()-object maken, een Doc-container maken en een text-string verwerken die voor je klaarstaat.
Het en_core_web_sm-model is al gedownload.
Deze oefening maakt deel uit van de cursus
Natural Language Processing met spaCy
Oefeninstructies
- Laad
en_core_web_smen maak eennlp-object. - Maak een
doc-container van detext-string. - Maak een lijst met de tekst van elke token in de
doc-container.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load en_core_web_sm and create an nlp object
nlp = spacy.____(____)
# Create a Doc container for the text object
doc = ____(____)
# Create a list containing the text of each token in the Doc container
print([____ for ____ in ____])