Ülkeleri ve ilişkileri çıkarmak
Önceki egzersizde, metindeki ülke adlarını bulmak için spaCy'nin PhraseMatcherını kullanan bir betik yazdın. Hadi şimdi bu ülke eşleyiciyi daha uzun bir metin üzerinde kullanalım, sözdizimini analiz edelim ve belgedeki varlıkları eşleşen ülkelerle güncelleyelim. nlp nesnesi zaten oluşturuldu.
Metin text değişkeninde, ülke kalıplarını içeren PhraseMatcher ise matcher değişkeninde mevcut. Span sınıfı zaten içe aktarıldı.
Bu egzersiz, kursun bir parçasıdır
spaCy ile İleri Düzey NLP
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Create a doc and find matches in it
doc = ____
# Iterate over the matches
for match_id, start, end in matcher(doc):
# Create a Span with the label for "GPE"
span = ____(____, ____, ____, label=____)
# Overwrite the doc.ents and add the span
doc.ents = list(doc.ents) + [____]
# Print the entities in the document
print([(ent.text, ent.label_) for ent in doc.ents if ent.label_ == 'GPE'])