Aan de slagGa gratis aan de slag

Doc-container in spaCy

De eerste stap in een spaCy-tekstverwerkingspijplijn is het omzetten van een gegeven tekststring naar een Doc-container, waarin de verwerkte tekst wordt opgeslagen. In deze oefening ga je een spaCy-model laden, een nlp()-object maken, een Doc-container maken en een text-string verwerken die voor je klaarstaat.

Het en_core_web_sm-model is al gedownload.

Deze oefening maakt deel uit van de cursus

Natural Language Processing met spaCy

Cursus bekijken

Oefeninstructies

  • Laad en_core_web_sm en maak een nlp-object.
  • Maak een doc-container van de text-string.
  • Maak een lijst met de tekst van elke token in de doc-container.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Load en_core_web_sm and create an nlp object
nlp = spacy.____(____)

# Create a Doc container for the text object
doc = ____(____)

# Create a list containing the text of each token in the Doc container
print([____ for ____ in ____])
Code bewerken en uitvoeren