Exécuter un pipeline spaCy
Vous avez déjà exécuté un pipeline NLP de spaCy sur un texte unique et extrait des jetons à partir d’une liste donnée de conteneurs Doc. Dans cet exercice, vous allez pratiquer les premières étapes de l’exécution d’un pipeline spaCy sur texts, qui est une liste de chaînes de caractères.
Vous utiliserez le modèle en_core_web_sm pour cela. Le paquet spaCy a déjà été importé pour vous.
Cet exercice fait partie du cours
Traitement du langage naturel avec spaCy
Instructions
- Chargez le modèle
en_core_web_smsous le nomnlp. - Exécutez le modèle avec
nlp()sur chaque élément detexts, puis ajoutez chaque conteneurDoccorrespondant à une listedocuments. - Affichez le texte des jetons pour chaque conteneur
Docde la listedocuments.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load en_core_web_sm model as nlp
nlp = spacy.____(____)
# Run an nlp model on each item of texts and append the Doc container to documents
documents = []
for text in ____:
documents.append(____)
# Print the token texts for each Doc container
for doc in documents:
print([____ for ____ in ____])