Creare dati di training (1)

Il Matcher basato su regole di spaCy è un ottimo modo per creare rapidamente dati di training per i modelli di riconoscimento di entità. È disponibile un elenco di frasi nella variabile TEXTS. Puoi stamparla nella shell IPython per ispezionarla. Vogliamo trovare tutte le menzioni dei diversi modelli di iPhone, così da creare dati di training per insegnare a un modello a riconoscerli come 'GADGET'.

L'oggetto nlp è già stato creato per te e il Matcher è disponibile nella variabile matcher.

Questo esercizio fa parte del corso

NLP avanzato con spaCy

Visualizza corso

Istruzioni dell'esercizio

Scrivi un pattern per due token le cui forme in minuscolo corrispondano a 'iphone' e 'x'.
Scrivi un pattern per due token: un token la cui forma in minuscolo corrisponda a 'iphone' e una cifra facoltativa usando l'operatore '?'.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Two tokens whose lowercase forms match 'iphone' and 'x'
pattern1 = [{____: ____}, {____: ____}]

# Token whose lowercase form matches 'iphone' and an optional digit
pattern2 = [{____: ____}, {____: ____, ___: ____}]

# Add patterns to the matcher
matcher.add('GADGET', None, pattern1, pattern2)

Modifica ed esegui il codice