PhraseMatcher w spaCy

Podczas przetwarzania nieustrukturyzowanego tekstu często dysponujesz długimi listami i słownikami, które chcesz przeszukiwać i dopasowywać w danych tekstach. Wzorce klasy Matcher są tworzone ręcznie, a każdy token trzeba zakodować osobno. Jeśli masz do dyspozycji długą listę fraz, Matcher przestaje być najlepszym wyborem. W takim przypadku klasa PhraseMatcher pozwala dopasowywać obszerne słowniki. W tym ćwiczeniu przećwiczysz wyszukiwanie wzorców o pasujących kształtach dla wielu terminów za pomocą klasy PhraseMatcher.

Model en_core_web_sm jest już wczytany i dostępny jako nlp. Klasa PhraseMatcher jest zaimportowana. Do dyspozycji masz ciąg znaków text oraz listę terms.

Zainicjuj klasę PhraseMatcher z argumentem attr, który dopasowuje kształt podanych elementów listy terms.
Utwórz patterns, które dodasz do obiektu PhraseMatcher.
Znajdź dopasowania do podanych wzorców i wyświetl indeksy tokenów początku i końca oraz dopasowany fragment tekstu text.

exercițiu

PhraseMatcher w spaCy

Instrucțiuni

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}exercițiu

Instrucțiuni

exercițiu