1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie mowy w Pythonie

Connected

ćwiczenie

Tworzenie niestandardowej nazwanej encji w spaCy

Jeśli wbudowane nazwane encje biblioteki spaCy nie wystarczają, możesz tworzyć własne – za pomocą klasy EntityRuler().

EntityRuler() pozwala definiować własne encje i dodawać je do potoku spaCy.

Zaczynasz od utworzenia instancji EntityRuler() i przekazania jej bieżącego potoku, nlp.

Następnie wywołujesz na tej instancji metodę add_patterns(), przekazując jej słownik z wzorcem tekstowym pattern, który chcesz oznaczyć jako encję.

Gdy wzorzec jest już gotowy, dodajesz go do potoku nlp za pomocą add_pipe().

Ponieważ Acme jest firmą technologiczną, postanawiasz oznaczyć wzorzec "smartphone" tagiem encji "PRODUCT".

Biblioteka spaCy została już zaimportowana, a obiekt doc zawiera transkrybowany tekst z pliku call_4_channel_2.wav plik).

Instrukcje

100 XP
  • Zaimportuj EntityRuler z modułu spacy.pipeline.
  • Dodaj "smartphone" jako wartość klucza "pattern".
  • Dodaj instancję EntityRuler(), czyli ruler, do potoku nlp.
  • Wydrukuj atrybuty encji zawartych w obiekcie doc.