Python'da RegEx
Kural tabanlı bilgi çıkarımı birçok NLP görevi için kullanışlıdır. Tarihler veya telefon numaraları gibi bazı varlık türleri, herhangi bir modeli eğitmeye gerek kalmadan bir dizi kuralla tanınabilecek belirgin biçimlere sahiptir. Bu egzersizde, RegEx için re paketini kullanma pratiği yapacaksın. Amaç, verilen text içinde telefon numaralarını bulmaktır.
re paketi senin için içe aktarılmış durumda. 0'dan 9'a kadar olan herhangi bir rakamla eşleşen bir metakarakteri temsil eden dize kalıplarını yakalamak için \d kullanabilirsin.
Bu egzersiz
spaCy ile Natural Language Processing
kursunun bir parçasıdırEgzersiz talimatları
- (111)-111-1111 biçimindeki telefon numaralarıyla eşleşecek bir desen tanımla.
- Tüm eşleşen desenleri
re.finditer()yöntemiyle bul. - Her eşleşme için, verilen
textiçindeki başlangıç ve bitiş karakter indekslerini ve eşleşen bölümü yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
text = "Our phone number is (425)-123-4567."
# Define a pattern to match phone numbers
pattern = r"\((____){____}\)-(____){____}-(____){____}"
# Find all the matching patterns in the text
phones = re.____(pattern, text)
# Print start and end characters and matching section of the text
for match in phones:
start_char = match.____
end_char = match.____
print("Start character: ", ____, "| End character: ", ____, "| Matching text: ", text[____:____])