Desenleri hata ayıklama (2)
Bu egzersizdeki her iki desende de hatalar var ve beklendiği gibi eşleşmeyecekler. Onları düzeltebilir misin?
nlp ve bir doc senin için zaten oluşturuldu. Takılırsan, metnin nasıl bölüneceğini görmek için doc içindeki tokenları yazdırmayı dene ve her sözlüğün bir tokenı temsil edecek şekilde deseni ayarla.
Bu egzersiz, kursun bir parçasıdır
spaCy ile İleri Düzey NLP
Egzersiz talimatları
pattern1'i düzenleyip"Amazon"un harf büyüklüğünden bağımsız tüm kullanımlarını ve ardından büyük harfle başlayan bir özel ismi doğru şekilde eşleştir.pattern2'yi düzenleyip"ad-free"in harf büyüklüğünden bağımsız tüm kullanımlarını ve ardından gelen bir ismi doğru şekilde eşleştir.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Create the match patterns
pattern1 = [{'LOWER': 'Amazon'}, {'IS_TITLE': True, 'POS': 'PROPN'}]
pattern2 = [{'LOWER': 'ad-free'}, {'POS': 'NOUN'}]
# Initialize the Matcher and add the patterns
matcher = Matcher(nlp.vocab)
matcher.add('PATTERN1', None, pattern1)
matcher.add('PATTERN2', None, pattern2)
# Iterate over the matches
for match_id, start, end in matcher(doc):
# Print pattern string name and text of matched span
print(doc.vocab.strings[match_id], doc[start:end].text)