BaşlayınÜcretsiz Başlayın

spaCy ile Span benzerliği

Anlamsal benzerliği belirlemek, metinleri önceden tanımlı kategorilere ayırmana, ilgili metinleri tespit etmene veya yinelenen içerikleri işaretlemene yardımcı olabilir. Bu egzersizde, bir belgenin bölümlerinin (span) bir referans belgeye olan anlamsal benzerliklerini hesaplama pratiği yapacaksın. Amaç, konserve köpek maması ile en ilgili üç token'lık Spanı bulmak.

konserve köpek maması kategorisi category değişkeninde tutuluyor. Bir metin dizesi text nesnesinde hazır ve en_core_web_md modeli nlp olarak yüklendi. textin Doc konteyneri de oluşturuldu ve document olarak saklandı.

Bu egzersiz

spaCy ile Natural Language Processing

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • category için bir Doc konteyneri oluştur ve category_document olarak sakla.
  • Verilen bir Span ile category_documentın benzerlik skorunu, üç basamağa yuvarlanmış şekilde yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Create a Doc container for the category
category = "canned dog food"
category_document = nlp(____)

# Print similarity score of a given Span and category_document
document_span = document[0:3]
print(f"Semantic similarity with", document_span.text, ":", round(document_span.____(____), 3))
Kodu Düzenle ve Çalıştır