Metin kategorize etmek için anlamsal benzerlik
Anlamsal benzerliğin temel amacı, bir çift sözcük, ifade, cümle veya belge arasındaki anlamsal anlamların uzaklığını ölçmektir. Örneğin, “car” sözcüğü “cat”ten çok “bus”a daha benzer. Bu egzersizde, Amazon Fine Food Reviews içindeki örnek bir metinden sauce sözcüğüne benzer cümleleri bulacaksın. Verilen bir texts dizesindeki cümlelerin her biriyle sauce sözcüğünün benzerlik skorunu hesaplamak ve en benzer cümlenin skorunu raporlamak için spacy kullanabilirsin.
Tüm incelemelerin Text verilerini içeren bir texts dizesi önceden yüklendi. Bu egzersizde İngilizce en_core_web_md modelini kullanacaksın ve bu model nlp olarak hazır durumda.
Bu egzersiz
spaCy ile Natural Language Processing
kursunun bir parçasıdırEgzersiz talimatları
saucesözcüğü vetextsiçinnlpkullanarakDockapsayıcıları oluştur ve bunları sırasıylakeyvesentencesiçinde sakla.textsdizesindeki her cümle ilesaucesözcüğünün benzerlik skorlarını (iki basamağa yuvarlanmış) hesapla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Populate Doc containers for the word "sauce" and for "texts" string
key = ____
sentences = ____
# Calculate similarity score of each sentence and a Doc container for the word sauce
semantic_scores = []
for sent in sentences.____:
semantic_scores.append({"score": round(sent.____(____), 2)})
print(semantic_scores)