CommencerCommencer gratuitement

Conteneur Doc dans spaCy

La première étape d’un pipeline de traitement de texte avec spaCy consiste à convertir une chaîne de caractères en un conteneur Doc, qui stocke le texte traité. Dans cet exercice, vous allez vous entraîner à charger un modèle spaCy, à créer un objet nlp(), à créer un conteneur Doc et à traiter une chaîne text qui vous est fournie.

Le modèle en_core_web_sm est déjà téléchargé.

Cet exercice fait partie du cours

Traitement du langage naturel avec spaCy

Afficher le cours

Instructions

  • Chargez en_core_web_sm et créez un objet nlp.
  • Créez un conteneur doc à partir de la chaîne text.
  • Créez une liste contenant le texte de chaque token dans le conteneur doc.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Load en_core_web_sm and create an nlp object
nlp = spacy.____(____)

# Create a Doc container for the text object
doc = ____(____)

# Create a list containing the text of each token in the Doc container
print([____ for ____ in ____])
Modifier et exécuter le code