Composants avec extensions
Les attributs d’extension sont particulièrement puissants lorsqu’ils sont combinés à des composants de pipeline personnalisés. Dans cet exercice, vous allez écrire un composant de pipeline qui repère les noms de pays et un attribut d’extension personnalisé qui renvoie la capitale d’un pays, lorsque disponible.
L’objet nlp a déjà été créé et la classe Span est déjà importée. Un phrase matcher contenant tous les pays est disponible dans la variable matcher. Un dictionnaire faisant correspondre chaque pays à sa capitale est disponible dans la variable capitals.
Cet exercice fait partie du cours
NLP avancé avec spaCy
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
def countries_component(doc):
# Create an entity Span with the label 'GPE' for all matches
doc.ents = [____(____, ____, ____, label=____)
for match_id, start, end in matcher(doc)]
return doc
# Add the component to the pipeline
____.____(____)
print(nlp.pipe_names)