Boş spaCy modeliyle EntityRuler
EntityRuler, varlıkları doc.ents içine eklemene olanak tanır. Doğruluğu artırmak için adlandırılmış varlık tanıma amacıyla kullanılan bir spaCy işlem hattı bileşeni olan EntityRecognizer ile birlikte kullanılabilir ya da tek başına tamamen kural tabanlı bir varlık tanıma sistemi olarak uygulanabilir. Bu egzersizde, boş bir İngilizce spaCy modeline bir EntityRuler bileşeni eklemeyi pratik yapacak ve verilen text içindeki adlandırılmış varlıkları tamamen kural tabanlı adlandırılmış varlık tanıma ile sınıflandıracaksın.
spaCy paketi zaten içe aktarıldı ve kullanımın için nlp olarak hazır bir boş İngilizce spaCy modeli mevcut. Küçük harfli OpenAI ve Microsoft ifadelerini ORG olarak sınıflandırmak için bir patterns listesi senin için hazırlandı.
Bu egzersiz
spaCy ile Natural Language Processing
kursunun bir parçasıdırEgzersiz talimatları
- İşlem hattına bir
EntityRulerbileşeni oluşturup ekle. - Verilen pattern'ları
EntityRulerbileşenine ekle. - Verilen
textüzerinde modeli çalıştır ve buna karşılık gelenDockapsayıcısını oluştur. Dockapsayıcısındaki tüm varlıklar için (varlık metni ve türü) ikililerini yazdır
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
nlp = spacy.blank("en")
patterns = [{"label": "ORG", "pattern": [{"LOWER": "openai"}]},
{"label": "ORG", "pattern": [{"LOWER": "microsoft"}]}]
text = "OpenAI has joined forces with Microsoft."
# Add EntityRuler component to the model
entity_ruler = nlp.____("entity_ruler")
# Add given patterns to the EntityRuler component
entity_ruler.____(____)
# Run the model on a given text
doc = nlp(____)
# Print entities text and type for all entities in the Doc container
print([(ent.____, ent.____) for ent in doc.____])