BaşlayınÜcretsiz başlayın

Boş spaCy modeliyle EntityRuler

EntityRuler, varlıkları doc.ents içine eklemene olanak tanır. Doğruluğu artırmak için adlandırılmış varlık tanıma amacıyla kullanılan bir spaCy işlem hattı bileşeni olan EntityRecognizer ile birlikte kullanılabilir ya da tek başına tamamen kural tabanlı bir varlık tanıma sistemi olarak uygulanabilir. Bu egzersizde, boş bir İngilizce spaCy modeline bir EntityRuler bileşeni eklemeyi pratik yapacak ve verilen text içindeki adlandırılmış varlıkları tamamen kural tabanlı adlandırılmış varlık tanıma ile sınıflandıracaksın.

spaCy paketi zaten içe aktarıldı ve kullanımın için nlp olarak hazır bir boş İngilizce spaCy modeli mevcut. Küçük harfli OpenAI ve Microsoft ifadelerini ORG olarak sınıflandırmak için bir patterns listesi senin için hazırlandı.

Bu egzersiz, kursun bir parçasıdır

spaCy ile Natural Language Processing

Kursa Göz Atın

Egzersiz talimatları

  • İşlem hattına bir EntityRuler bileşeni oluşturup ekle.
  • Verilen pattern'ları EntityRuler bileşenine ekle.
  • Verilen text üzerinde modeli çalıştır ve buna karşılık gelen Doc kapsayıcısını oluştur.
  • Doc kapsayıcısındaki tüm varlıklar için (varlık metni ve türü) ikililerini yazdır

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

nlp = spacy.blank("en")
patterns = [{"label": "ORG", "pattern": [{"LOWER": "openai"}]},
            {"label": "ORG", "pattern": [{"LOWER": "microsoft"}]}]
text = "OpenAI has joined forces with Microsoft."

# Add EntityRuler component to the model
entity_ruler = nlp.____("entity_ruler")

# Add given patterns to the EntityRuler component
entity_ruler.____(____)

# Run the model on a given text
doc = nlp(____)

# Print entities text and type for all entities in the Doc container
print([(ent.____, ent.____) for ent in doc.____])
Kodu Düzenle ve Çalıştır