BaşlayınÜcretsiz Başlayın

Boş spaCy modeliyle EntityRuler

EntityRuler, varlıkları doc.ents içine eklemene olanak tanır. Doğruluğu artırmak için adlandırılmış varlık tanıma amacıyla kullanılan bir spaCy işlem hattı bileşeni olan EntityRecognizer ile birlikte kullanılabilir ya da tek başına tamamen kural tabanlı bir varlık tanıma sistemi olarak uygulanabilir. Bu egzersizde, boş bir İngilizce spaCy modeline bir EntityRuler bileşeni eklemeyi pratik yapacak ve verilen text içindeki adlandırılmış varlıkları tamamen kural tabanlı adlandırılmış varlık tanıma ile sınıflandıracaksın.

spaCy paketi zaten içe aktarıldı ve kullanımın için nlp olarak hazır bir boş İngilizce spaCy modeli mevcut. Küçük harfli OpenAI ve Microsoft ifadelerini ORG olarak sınıflandırmak için bir patterns listesi senin için hazırlandı.

Bu egzersiz

spaCy ile Natural Language Processing

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • İşlem hattına bir EntityRuler bileşeni oluşturup ekle.
  • Verilen pattern'ları EntityRuler bileşenine ekle.
  • Verilen text üzerinde modeli çalıştır ve buna karşılık gelen Doc kapsayıcısını oluştur.
  • Doc kapsayıcısındaki tüm varlıklar için (varlık metni ve türü) ikililerini yazdır

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

nlp = spacy.blank("en")
patterns = [{"label": "ORG", "pattern": [{"LOWER": "openai"}]},
            {"label": "ORG", "pattern": [{"LOWER": "microsoft"}]}]
text = "OpenAI has joined forces with Microsoft."

# Add EntityRuler component to the model
entity_ruler = nlp.____("entity_ruler")

# Add given patterns to the EntityRuler component
entity_ruler.____(____)

# Run the model on a given text
doc = nlp(____)

# Print entities text and type for all entities in the Doc container
print([(ent.____, ent.____) for ent in doc.____])
Kodu Düzenle ve Çalıştır