Metin kategorize etmek için anlamsal benzerlik

Anlamsal benzerliğin temel amacı, bir çift sözcük, ifade, cümle veya belge arasındaki anlamsal anlamların uzaklığını ölçmektir. Örneğin, “car” sözcüğü “cat”ten çok “bus”a daha benzer. Bu egzersizde, Amazon Fine Food Reviews içindeki örnek bir metinden sauce sözcüğüne benzer cümleleri bulacaksın. Verilen bir texts dizesindeki cümlelerin her biriyle sauce sözcüğünün benzerlik skorunu hesaplamak ve en benzer cümlenin skorunu raporlamak için spacy kullanabilirsin.

Tüm incelemelerin Text verilerini içeren bir texts dizesi önceden yüklendi. Bu egzersizde İngilizce en_core_web_md modelini kullanacaksın ve bu model nlp olarak hazır durumda.

Bu egzersiz, kursun bir parçasıdır

spaCy ile Natural Language Processing

Kursa Göz Atın

Egzersiz talimatları

sauce sözcüğü ve texts için nlp kullanarak Doc kapsayıcıları oluştur ve bunları sırasıyla key ve sentences içinde sakla.
texts dizesindeki her cümle ile sauce sözcüğünün benzerlik skorlarını (iki basamağa yuvarlanmış) hesapla.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Populate Doc containers for the word "sauce" and for "texts" string
key = ____
sentences = ____

# Calculate similarity score of each sentence and a Doc container for the word sauce
semantic_scores = []
for sent in sentences.____:
	semantic_scores.append({"score": round(sent.____(____), 2)})
print(semantic_scores)

Kodu Düzenle ve Çalıştır

Bu egzersiz, kursun bir parçasıdır

spaCy ile Natural Language Processing

IntermediárioNível de habilidade

4.8+

Kursa Ücretsiz Başla

Bu bölümde seni NLP’ye ve adlandırılmış varlık tanıma ile yapay zekâ destekli sohbet botları gibi bazı kullanım alanlarına girişle tanıştıracağız. Güçlü spaCy kütüphanesini kullanarak tokenizasyon, cümle bölütleme, POS etiketleme ve adlandırılmış varlık tanıma gibi çeşitli doğal dil işleme görevlerini nasıl yapacağını öğreneceksin.

Exercise 1: Doğal Dil İşleme (NLP) temelleri Exercise 2: spaCy'de Doc kapsayıcısı Exercise 3: NER kullanım durumu Exercise 4: spaCy ile Tokenization Exercise 5: spaCy temelleri Exercise 6: Bir spaCy işlem hattını çalıştırma Exercise 7: spaCy ile Lemmatization Exercise 8: spaCy ile cümle bölütleme Exercise 9: spaCy’de dilbilimsel özellikler Exercise 10: spaCy ile POS etiketleme Exercise 11: spaCy ile NER Exercise 12: spaCy ile metin işleme

Dilbilimsel özellikler, sözcük vektörleri, anlamsal benzerlik, benzetimler ve vektör işlemleri hakkında bilgi edin. Bu bölümde spaCy’yi kullanarak sözcük vektörlerini nasıl çıkaracağını, belirli bir konuya ilgili metinleri nasıl kategorize edeceğini ve bir derlemden ya da spaCy model söz varlığından verilen kelimelere anlamsal olarak benzer terimleri nasıl bulacağını keşfedeceksin.

Exercise 1: Dilbilimsel özellikler Exercise 2: spaCy’de dilbilimsel açıklamalar Exercise 3: spaCy ile sözcük anlamı ayrıştırma Exercise 4: spaCy ile bağımlılık çözümlemesi Exercise 5: Kelime vektörlerine giriş Exercise 6: spaCy söz varlığı Exercise 7: spaCy söz varlığında kelime vektörleri Exercise 8: Kelime vektörleri ve spaCy Exercise 9: Benzetimler ve vektör işlemleri Exercise 10: Kelime vektörlerinin izdüşümü Exercise 11: Bir sözlükte benzer kelimeler Exercise 12: spaCy ile anlamsal benzerliği ölçme Exercise 13: spaCy ile Doc benzerliği Exercise 14: spaCy ile Span benzerliği Exercise 15: Metin kategorize etmek için anlamsal benzerlik

Geçerli egzersiz

spaCy işlem hattı bileşenlerine, yeni bir bileşenin nasıl ekleneceğine ve NLP işlem hattının nasıl analiz edileceğine alış. Ayrıca spaCy’deki EntityRuler, Matcher ve PhraseMatcher sınıfları ile Python’un RegEx paketi kullanılarak kural tabanlı bilgi çıkarımına yönelik birden çok yaklaşımı öğreneceksin.

Exercise 1: spaCy işlem hatları Exercise 2: spaCy'de pipe ekleme Exercise 3: spaCy'de boru hatlarını analiz etme Exercise 4: spaCy EntityRuler Exercise 5: Boş spaCy modeliyle EntityRuler Exercise 6: NER için EntityRuler Exercise 7: spaCy'de çoklu desenlerle EntityRuler Exercise 8: spaCy ile RegEx Exercise 9: Python'da RegEx Exercise 10: spaCy'de EntityRuler ile RegEx Exercise 11: spaCy Matcher ve PhraseMatcher Exercise 12: spaCy'de tek bir terimi eşleştirme Exercise 13: spaCy'de PhraseMatcher Exercise 14: spaCy'de genişletilmiş söz dizimiyle eşleştirme

spaCy modellerinin başarısız olabileceği çeşitli gerçek dünya kullanım durumlarını keşfet ve model performansını artırmak için onları nasıl daha ileri eğiteceğini öğren. spaCy eğitim adımlarına giriş yapacak, mevcut bir spaCy modelini ya da sıfırdan bir modeli nasıl eğiteceğini ve modeli çıkarım zamanında nasıl değerlendireceğini anlayacaksın.

Exercise 1: spaCy modellerini özelleştirme Exercise 2: spaCy modellerini eğitme Exercise 3: Verilerinde model performansı Exercise 4: spaCy eğitim veri biçimi Exercise 5: Eğitim adımları Exercise 6: Açıklama ve eğitim verisini hazırlama Exercise 7: Uyumlu eğitim verileri Exercise 8: spaCy ile eğitim Exercise 9: Eğitime hazırlık adımları Exercise 10: Mevcut bir NER modelini eğit Exercise 11: Sıfırdan bir spaCy modeli eğitme Exercise 12: Kapanış