1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Zpracování mluveného jazyka v Pythonu

Connected

cvičení

Vytvoření vlastní pojmenované entity v spaCy

Pokud nestačí vestavěné pojmenované entity spaCy, můžeš si vytvořit vlastní pomocí třídy EntityRuler().

EntityRuler() ti umožňuje definovat vlastní entity a přidat je do pipeline spaCy.

Začneš tím, že vytvoříš instanci EntityRuler() a předáš jí aktuální pipeline nlp.

Poté na instanci zavoláš add_patterns() a předáš jí slovník se vzorem pattern, který chceš označit jako entitu.

Jakmile vzor nastavíš, přidáš ho do pipeline nlp pomocí add_pipe().

Protože Acme je technologická společnost, rozhodneš se označit vzor "smartphone" tagem entity "PRODUCT".

spaCy je již naimportováno a existuje objekt doc obsahující přepsaný text ze souboru call_4_channel_2.wav file).

Pokyny

100 XP
  • Importuj EntityRuler z spacy.pipeline.
  • Přidej "smartphone" jako hodnotu klíče "pattern".
  • Přidej instanci EntityRuler(), ruler, do pipeline nlp.
  • Vypiš atributy entit obsažených v doc.