1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie języka naturalnego z użyciem spaCy

Connected

ćwiczenie

RegEx w Pythonie

Ekstrakcja informacji oparta na regułach przydaje się w wielu zadaniach NLP. Niektóre typy encji – na przykład daty czy numery telefonów – mają charakterystyczny format, który można rozpoznać za pomocą zestawu reguł, bez konieczności trenowania jakiegokolwiek modelu. W tym ćwiczeniu przećwiczysz korzystanie z pakietu re do obsługi wyrażeń regularnych (RegEx). Celem jest znalezienie numerów telefonów w podanym text.

Pakiet re jest już zaimportowany. Możesz użyć \d do dopasowywania wzorców reprezentujących metaznak pasujący do dowolnej cyfry od 0 do 9.

Instrukcje

100 XP
  • Zdefiniuj wzorzec dopasowujący numery telefonów w formacie (111)-111-1111.
  • Znajdź wszystkie pasujące wzorce, używając metody re.finditer().
  • Dla każdego dopasowania wypisz pozycję początkową i końcową oraz odpowiadający fragment podanego text.