spaCy ile Span benzerliği
Anlamsal benzerliği belirlemek, metinleri önceden tanımlı kategorilere ayırmana, ilgili metinleri tespit etmene veya yinelenen içerikleri işaretlemene yardımcı olabilir. Bu egzersizde, bir belgenin bölümlerinin (span) bir referans belgeye olan anlamsal benzerliklerini hesaplama pratiği yapacaksın. Amaç, konserve köpek maması ile en ilgili üç token'lık Spanı bulmak.
konserve köpek maması kategorisi category değişkeninde tutuluyor. Bir metin dizesi text nesnesinde hazır ve en_core_web_md modeli nlp olarak yüklendi. textin Doc konteyneri de oluşturuldu ve document olarak saklandı.
Bu egzersiz, kursun bir parçasıdır
spaCy ile Natural Language Processing
Egzersiz talimatları
categoryiçin birDockonteyneri oluştur vecategory_documentolarak sakla.- Verilen bir
Spanilecategory_documentın benzerlik skorunu, üç basamağa yuvarlanmış şekilde yazdır.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Create a Doc container for the category
category = "canned dog food"
category_document = nlp(____)
# Print similarity score of a given Span and category_document
document_span = document[0:3]
print(f"Semantic similarity with", document_span.text, ":", round(document_span.____(____), 3))