Conteneur Doc dans spaCy
La première étape d’un pipeline de traitement de texte avec spaCy consiste à convertir une chaîne de caractères en un conteneur Doc, qui stocke le texte traité. Dans cet exercice, vous allez vous entraîner à charger un modèle spaCy, à créer un objet nlp(), à créer un conteneur Doc et à traiter une chaîne text qui vous est fournie.
Le modèle en_core_web_sm est déjà téléchargé.
Cet exercice fait partie du cours
Traitement du langage naturel avec spaCy
Instructions
- Chargez
en_core_web_smet créez un objetnlp. - Créez un conteneur
docà partir de la chaînetext. - Créez une liste contenant le texte de chaque token dans le conteneur
doc.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load en_core_web_sm and create an nlp object
nlp = spacy.____(____)
# Create a Doc container for the text object
doc = ____(____)
# Create a list containing the text of each token in the Doc container
print([____ for ____ in ____])