spaCy'de genişletilmiş söz dizimiyle eşleştirme

Kural tabanlı bilgi çıkarımı, herhangi bir NLP işlem hattı için çok önemlidir. Matcher sınıfı, süslü parantezlerin içinde bazı operatörlere izin vererek kalıpların daha ifade gücü yüksek olmasını sağlar. Bu operatörler genişletilmiş karşılaştırmalar içindir ve Python'daki in, not in ve karşılaştırma operatörlerine benzer. Bu egzersizde, örnek bir metinden verilen terimlere eşleşmeler bulmak için spaCy'nin eşleştirme işlevselliği olan Matcher ile pratik yapacaksın.

Matcher sınıfı spacy.matcher kütüphanesinden zaten içe aktarıldı. Bu egzersizde doc çağrısıyla örnek bir metnin Doc kapsayıcısını kullanacaksın. Önceden yüklenmiş bir spaCy modeli de nlp olarak erişilebilir durumdadır.

Bu egzersiz, kursun bir parçasıdır

spaCy ile Natural Language Processing

Kursa Göz Atın

Egzersiz talimatları

Matcher ve nlp kullanarak bir matcher nesnesi tanımla.
IN operatörünü kullanarak tiny squares ve tiny mouthful ifadelerine eşleşecek bir kalıp tanımla.
Bu kalıbı kullanarak doc için eşleşmeleri bul.
Eşleşmelerin başlangıç ve bitiş token indekslerini ve metin aralığını yazdır.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

nlp = spacy.load("en_core_web_sm")
doc = nlp(example_text)

# Define a matcher object
matcher = Matcher(nlp.____)
# Define a pattern to match tiny squares and tiny mouthful
pattern = [{"lower": ____}, {"lower": {____: ["squares", "mouthful"]}}]

# Add the pattern to matcher object and find matches
matcher.____("CustomMatcher", [____])
matches = ____(____)

# Print out start and end token indices and the matched text span per match
for match_id, start, end in matches:
    print("Start token: ", ____, " | End token: ", ____, "| Matched text: ", doc[____:____].text)

Kodu Düzenle ve Çalıştır

Bu egzersiz, kursun bir parçasıdır

spaCy ile Natural Language Processing

IntermediárioNível de habilidade

4.8+

Kursa Ücretsiz Başla

Bu bölümde seni NLP’ye ve adlandırılmış varlık tanıma ile yapay zekâ destekli sohbet botları gibi bazı kullanım alanlarına girişle tanıştıracağız. Güçlü spaCy kütüphanesini kullanarak tokenizasyon, cümle bölütleme, POS etiketleme ve adlandırılmış varlık tanıma gibi çeşitli doğal dil işleme görevlerini nasıl yapacağını öğreneceksin.

Exercise 1: Doğal Dil İşleme (NLP) temelleri Exercise 2: spaCy'de Doc kapsayıcısı Exercise 3: NER kullanım durumu Exercise 4: spaCy ile Tokenization Exercise 5: spaCy temelleri Exercise 6: Bir spaCy işlem hattını çalıştırma Exercise 7: spaCy ile Lemmatization Exercise 8: spaCy ile cümle bölütleme Exercise 9: spaCy’de dilbilimsel özellikler Exercise 10: spaCy ile POS etiketleme Exercise 11: spaCy ile NER Exercise 12: spaCy ile metin işleme

Dilbilimsel özellikler, sözcük vektörleri, anlamsal benzerlik, benzetimler ve vektör işlemleri hakkında bilgi edin. Bu bölümde spaCy’yi kullanarak sözcük vektörlerini nasıl çıkaracağını, belirli bir konuya ilgili metinleri nasıl kategorize edeceğini ve bir derlemden ya da spaCy model söz varlığından verilen kelimelere anlamsal olarak benzer terimleri nasıl bulacağını keşfedeceksin.

Exercise 1: Dilbilimsel özellikler Exercise 2: spaCy’de dilbilimsel açıklamalar Exercise 3: spaCy ile sözcük anlamı ayrıştırma Exercise 4: spaCy ile bağımlılık çözümlemesi Exercise 5: Kelime vektörlerine giriş Exercise 6: spaCy söz varlığı Exercise 7: spaCy söz varlığında kelime vektörleri Exercise 8: Kelime vektörleri ve spaCy Exercise 9: Benzetimler ve vektör işlemleri Exercise 10: Kelime vektörlerinin izdüşümü Exercise 11: Bir sözlükte benzer kelimeler Exercise 12: spaCy ile anlamsal benzerliği ölçme Exercise 13: spaCy ile Doc benzerliği Exercise 14: spaCy ile Span benzerliği Exercise 15: Metin kategorize etmek için anlamsal benzerlik

spaCy işlem hattı bileşenlerine, yeni bir bileşenin nasıl ekleneceğine ve NLP işlem hattının nasıl analiz edileceğine alış. Ayrıca spaCy’deki EntityRuler, Matcher ve PhraseMatcher sınıfları ile Python’un RegEx paketi kullanılarak kural tabanlı bilgi çıkarımına yönelik birden çok yaklaşımı öğreneceksin.

Exercise 1: spaCy işlem hatları Exercise 2: spaCy'de pipe ekleme Exercise 3: spaCy'de boru hatlarını analiz etme Exercise 4: spaCy EntityRuler Exercise 5: Boş spaCy modeliyle EntityRuler Exercise 6: NER için EntityRuler Exercise 7: spaCy'de çoklu desenlerle EntityRuler Exercise 8: spaCy ile RegEx Exercise 9: Python'da RegEx Exercise 10: spaCy'de EntityRuler ile RegEx Exercise 11: spaCy Matcher ve PhraseMatcher Exercise 12: spaCy'de tek bir terimi eşleştirme Exercise 13: spaCy'de PhraseMatcher Exercise 14: spaCy'de genişletilmiş söz dizimiyle eşleştirme

Geçerli egzersiz

spaCy modellerinin başarısız olabileceği çeşitli gerçek dünya kullanım durumlarını keşfet ve model performansını artırmak için onları nasıl daha ileri eğiteceğini öğren. spaCy eğitim adımlarına giriş yapacak, mevcut bir spaCy modelini ya da sıfırdan bir modeli nasıl eğiteceğini ve modeli çıkarım zamanında nasıl değerlendireceğini anlayacaksın.

Exercise 1: spaCy modellerini özelleştirme Exercise 2: spaCy modellerini eğitme Exercise 3: Verilerinde model performansı Exercise 4: spaCy eğitim veri biçimi Exercise 5: Eğitim adımları Exercise 6: Açıklama ve eğitim verisini hazırlama Exercise 7: Uyumlu eğitim verileri Exercise 8: spaCy ile eğitim Exercise 9: Eğitime hazırlık adımları Exercise 10: Mevcut bir NER modelini eğit Exercise 11: Sıfırdan bir spaCy modeli eğitme Exercise 12: Kapanış