1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie języka naturalnego z użyciem spaCy

Connected

ćwiczenie

EntityRuler z pustym modelem spaCy

EntityRuler pozwala dodawać encje do doc.ents. Można go łączyć z EntityRecognizer – komponentem potoku spaCy do rozpoznawania nazwanych encji – w celu zwiększenia dokładności, lub używać samodzielnie jako czysto regułowego systemu rozpoznawania encji. W tym ćwiczeniu przećwiczysz dodawanie komponentu EntityRuler do pustego modelu angielskiego spaCy i klasyfikowanie nazwanych encji w podanym text przy użyciu wyłącznie reguł.

Pakiet spaCy jest już zaimportowany, a pusty angielski model spaCy jest dostępny jako nlp. Lista patterns klasyfikująca OpenAI i Microsoft (pisane małymi literami) jako ORG jest już gotowa do użycia.

Instrukcje

100 XP
  • Utwórz komponent EntityRuler i dodaj go do potoku.
  • Dodaj podane wzorce do komponentu EntityRuler.
  • Uruchom model na podanym text i utwórz odpowiadający mu kontener Doc.
  • Wyświetl krotki zawierające tekst i typ każdej encji z kontenera Doc.