Ülkeleri ve ilişkileri çıkarmak
Önceki egzersizde, metindeki ülke adlarını bulmak için spaCy'nin PhraseMatcherını kullanan bir betik yazdın. Hadi şimdi bu ülke eşleyiciyi daha uzun bir metin üzerinde kullanalım, sözdizimini analiz edelim ve belgedeki varlıkları eşleşen ülkelerle güncelleyelim. nlp nesnesi zaten oluşturuldu.
Metin text değişkeninde, ülke kalıplarını içeren PhraseMatcher ise matcher değişkeninde mevcut. Span sınıfı zaten içe aktarıldı.
Bu egzersiz
spaCy ile İleri Düzey NLP
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create a doc and find matches in it
doc = ____
# Iterate over the matches
for match_id, start, end in matcher(doc):
# Create a Span with the label for "GPE"
span = ____(____, ____, ____, label=____)
# Overwrite the doc.ents and add the span
doc.ents = list(doc.ents) + [____]
# Print the entities in the document
print([(ent.text, ent.label_) for ent in doc.ents if ent.label_ == 'GPE'])