1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie języka naturalnego z użyciem spaCy

Connected

ćwiczenie

Dopasowywanie z rozszerzoną składnią w spaCy

Ekstrakcja informacji oparta na regułach jest niezbędnym elementem każdego potoku NLP. Klasa Matcher umożliwia tworzenie bardziej wyrazistych wzorców dzięki operatorom umieszczanym wewnątrz nawiasów klamrowych. Operatory te służą do rozszerzonych porównań i przypominają składnią operatory in, not in oraz operatory porównania znane z Pythona. W tym ćwiczeniu przećwiczysz działanie mechanizmu dopasowywania w spaCy – klasy Matcher – aby znaleźć dopasowania do podanych wyrażeń w przykładowym tekście.

Klasa Matcher jest już zaimportowana z biblioteki spacy.matcher. Do pracy z przykładowym tekstem wykorzystasz kontener Doc, wywołując doc. Wstępnie załadowany model spaCy jest dostępny pod nazwą nlp.

Instrukcje

100 XP
  • Zdefiniuj obiekt matchera, używając Matcher i nlp.
  • Użyj operatora IN, aby zdefiniować wzorzec dopasowujący wyrażenia tiny squares i tiny mouthful.
  • Użyj tego wzorca, aby znaleźć dopasowania w doc.
  • Wyświetl indeksy tokenów początku i końca oraz fragment tekstu dla każdego dopasowania.