Desenleri hata ayıklama (2)
Bu egzersizdeki her iki desende de hatalar var ve beklendiği gibi eşleşmeyecekler. Onları düzeltebilir misin?
nlp ve bir doc senin için zaten oluşturuldu. Takılırsan, metnin nasıl bölüneceğini görmek için doc içindeki tokenları yazdırmayı dene ve her sözlüğün bir tokenı temsil edecek şekilde deseni ayarla.
Bu egzersiz
spaCy ile İleri Düzey NLP
kursunun bir parçasıdırEgzersiz talimatları
pattern1'i düzenleyip"Amazon"un harf büyüklüğünden bağımsız tüm kullanımlarını ve ardından büyük harfle başlayan bir özel ismi doğru şekilde eşleştir.pattern2'yi düzenleyip"ad-free"in harf büyüklüğünden bağımsız tüm kullanımlarını ve ardından gelen bir ismi doğru şekilde eşleştir.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create the match patterns
pattern1 = [{'LOWER': 'Amazon'}, {'IS_TITLE': True, 'POS': 'PROPN'}]
pattern2 = [{'LOWER': 'ad-free'}, {'POS': 'NOUN'}]
# Initialize the Matcher and add the patterns
matcher = Matcher(nlp.vocab)
matcher.add('PATTERN1', None, pattern1)
matcher.add('PATTERN2', None, pattern2)
# Iterate over the matches
for match_id, start, end in matcher(doc):
# Print pattern string name and text of matched span
print(doc.vocab.strings[match_id], doc[start:end].text)