1. Learn
  2. /
  3. Cursuri
  4. /
  5. Przetwarzanie języka naturalnego z użyciem spaCy

Connected

exercițiu

PhraseMatcher w spaCy

Podczas przetwarzania nieustrukturyzowanego tekstu często dysponujesz długimi listami i słownikami, które chcesz przeszukiwać i dopasowywać w danych tekstach. Wzorce klasy Matcher są tworzone ręcznie, a każdy token trzeba zakodować osobno. Jeśli masz do dyspozycji długą listę fraz, Matcher przestaje być najlepszym wyborem. W takim przypadku klasa PhraseMatcher pozwala dopasowywać obszerne słowniki. W tym ćwiczeniu przećwiczysz wyszukiwanie wzorców o pasujących kształtach dla wielu terminów za pomocą klasy PhraseMatcher.

Model en_core_web_sm jest już wczytany i dostępny jako nlp. Klasa PhraseMatcher jest zaimportowana. Do dyspozycji masz ciąg znaków text oraz listę terms.

Instrucțiuni

100 XP
  • Zainicjuj klasę PhraseMatcher z argumentem attr, który dopasowuje kształt podanych elementów listy terms.
  • Utwórz patterns, które dodasz do obiektu PhraseMatcher.
  • Znajdź dopasowania do podanych wzorców i wyświetl indeksy tokenów początku i końca oraz dopasowany fragment tekstu text.