1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie języka naturalnego z użyciem spaCy

Connected

ćwiczenie

Dopasowywanie pojedynczego terminu w spaCy

Wzorce RegEx bywają trudne do czytania, pisania i debugowania. Na szczęście spaCy oferuje czytelną alternatywę gotową do zastosowania w środowisku produkcyjnym – klasę Matcher. Klasa Matcher dopasowuje predefiniowane reguły do sekwencji tokenów w danym kontenerze Doc. W tym ćwiczeniu przećwiczysz użycie Matcher do wyszukania pojedynczego słowa.

Odpowiedni tekst znajdziesz w zmiennej example_text. Skorzystaj z nlp i doc, aby uzyskać dostęp odpowiednio do modelu spaCy i kontenera Doc dla example_text.

Instrukcje

100 XP
  • Zainicjalizuj klasę Matcher.
  • Zdefiniuj wzorzec dopasowujący słowo witch zapisane małymi literami w example_text.
  • Dodaj wzorce do klasy Matcher i znajdź dopasowania.
  • Przejdź przez dopasowania i wyświetl indeksy tokenów start i end oraz fragment dopasowanego tekstu.