1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie języka naturalnego z użyciem spaCy

Connected

ćwiczenie

EntityRuler z wieloma wzorcami w spaCy

EntityRuler pozwala dodawać encje do doc.ents i zwiększać skuteczność rozpoznawania nazwanych encji. W tym ćwiczeniu przećwiczysz dodawanie komponentu EntityRuler do istniejącego potoku nlp, aby kilka encji było poprawnie klasyfikowanych.

Model en_core_web_sm jest już wczytany i dostępny jako nlp. Przykładowy tekst znajdziesz w zmiennej example_text. Użyj nlp i doc, aby uzyskać dostęp odpowiednio do modelu spaCy i kontenera Doc dla example_text.

Instrukcje

100 XP
  • Wyświetl listę krotek zawierających tekst i typ encji z example_text przy użyciu modelu nlp.
  • Zdefiniuj wiele wzorców dopasowujących tokeny brother i sisters zapisane małymi literami do etykiety PERSON.
  • Dodaj komponent EntityRuler do potoku nlp i przypisz do niego zmienną patterns.
  • Wyświetl krotki zawierające tekst i typ encji dla example_text przy użyciu modelu nlp.