spaCy'de tek bir terimi eşleştirme

RegEx kalıplarını okumak, yazmak ve hata ayıklamak kolay değildir. Ama merak etme, spaCy okunabilir ve üretim seviyesinde bir alternatif sunuyor: Matcher sınıfı. Matcher sınıfı, verilen bir Doc kapsayıcısındaki token dizilerine önceden tanımlanmış kuralları eşleştirebilir. Bu egzersizde, tek bir kelimeyi bulmak için Matcher kullanmayı pratik edeceksin.

example_text içindeki ilgili metne erişebilir ve sırasıyla spaCy modeline ve example_text'in Doc kapsayıcısına erişmek için nlp ve doc değişkenlerini kullanabilirsin.

Bu egzersiz, kursun bir parçasıdır

spaCy ile Natural Language Processing

Kursa Göz Atın

Egzersiz talimatları

Bir Matcher sınıfı başlat.
example_text içinde küçük harfli witch kelimesini eşleyecek bir kalıp tanımla.
Kalıpları Matcher sınıfına ekle ve eşleşmeleri bul.
Eşleşmeler üzerinde yineleme yaparak başlangıç ve bitiş token indekslerini ve eşleşen metnin aralığını yazdır.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

nlp = spacy.load("en_core_web_sm")
doc = nlp(example_text)

# Initialize a Matcher object
matcher = Matcher(nlp.____)

# Define a pattern to match lower cased word witch
pattern = [{"lower" : ____}]

# Add the pattern to matcher object and find matches
matcher.add("CustomMatcher", [____])
matches = matcher(____)

# Print start and end token indices and span of the matched text
for match_id, start, end in matches:
    print("Start token: ", ____, " | End token: ", ____, "| Matched text: ", doc[____:____].text)

Kodu Düzenle ve Çalıştır

Bu egzersiz, kursun bir parçasıdır

spaCy ile Natural Language Processing

IntermediárioNível de habilidade

4.8+

Kursa Ücretsiz Başla

Bu bölümde seni NLP’ye ve adlandırılmış varlık tanıma ile yapay zekâ destekli sohbet botları gibi bazı kullanım alanlarına girişle tanıştıracağız. Güçlü spaCy kütüphanesini kullanarak tokenizasyon, cümle bölütleme, POS etiketleme ve adlandırılmış varlık tanıma gibi çeşitli doğal dil işleme görevlerini nasıl yapacağını öğreneceksin.

Exercise 1: Doğal Dil İşleme (NLP) temelleri Exercise 2: spaCy'de Doc kapsayıcısı Exercise 3: NER kullanım durumu Exercise 4: spaCy ile Tokenization Exercise 5: spaCy temelleri Exercise 6: Bir spaCy işlem hattını çalıştırma Exercise 7: spaCy ile Lemmatization Exercise 8: spaCy ile cümle bölütleme Exercise 9: spaCy’de dilbilimsel özellikler Exercise 10: spaCy ile POS etiketleme Exercise 11: spaCy ile NER Exercise 12: spaCy ile metin işleme

Dilbilimsel özellikler, sözcük vektörleri, anlamsal benzerlik, benzetimler ve vektör işlemleri hakkında bilgi edin. Bu bölümde spaCy’yi kullanarak sözcük vektörlerini nasıl çıkaracağını, belirli bir konuya ilgili metinleri nasıl kategorize edeceğini ve bir derlemden ya da spaCy model söz varlığından verilen kelimelere anlamsal olarak benzer terimleri nasıl bulacağını keşfedeceksin.

Exercise 1: Dilbilimsel özellikler Exercise 2: spaCy’de dilbilimsel açıklamalar Exercise 3: spaCy ile sözcük anlamı ayrıştırma Exercise 4: spaCy ile bağımlılık çözümlemesi Exercise 5: Kelime vektörlerine giriş Exercise 6: spaCy söz varlığı Exercise 7: spaCy söz varlığında kelime vektörleri Exercise 8: Kelime vektörleri ve spaCy Exercise 9: Benzetimler ve vektör işlemleri Exercise 10: Kelime vektörlerinin izdüşümü Exercise 11: Bir sözlükte benzer kelimeler Exercise 12: spaCy ile anlamsal benzerliği ölçme Exercise 13: spaCy ile Doc benzerliği Exercise 14: spaCy ile Span benzerliği Exercise 15: Metin kategorize etmek için anlamsal benzerlik

spaCy işlem hattı bileşenlerine, yeni bir bileşenin nasıl ekleneceğine ve NLP işlem hattının nasıl analiz edileceğine alış. Ayrıca spaCy’deki EntityRuler, Matcher ve PhraseMatcher sınıfları ile Python’un RegEx paketi kullanılarak kural tabanlı bilgi çıkarımına yönelik birden çok yaklaşımı öğreneceksin.

Exercise 1: spaCy işlem hatları Exercise 2: spaCy'de pipe ekleme Exercise 3: spaCy'de boru hatlarını analiz etme Exercise 4: spaCy EntityRuler Exercise 5: Boş spaCy modeliyle EntityRuler Exercise 6: NER için EntityRuler Exercise 7: spaCy'de çoklu desenlerle EntityRuler Exercise 8: spaCy ile RegEx Exercise 9: Python'da RegEx Exercise 10: spaCy'de EntityRuler ile RegEx Exercise 11: spaCy Matcher ve PhraseMatcher Exercise 12: spaCy'de tek bir terimi eşleştirme

Geçerli egzersiz

Exercise 13: spaCy'de PhraseMatcher Exercise 14: spaCy'de genişletilmiş söz dizimiyle eşleştirme

spaCy modellerinin başarısız olabileceği çeşitli gerçek dünya kullanım durumlarını keşfet ve model performansını artırmak için onları nasıl daha ileri eğiteceğini öğren. spaCy eğitim adımlarına giriş yapacak, mevcut bir spaCy modelini ya da sıfırdan bir modeli nasıl eğiteceğini ve modeli çıkarım zamanında nasıl değerlendireceğini anlayacaksın.

Exercise 1: spaCy modellerini özelleştirme Exercise 2: spaCy modellerini eğitme Exercise 3: Verilerinde model performansı Exercise 4: spaCy eğitim veri biçimi Exercise 5: Eğitim adımları Exercise 6: Açıklama ve eğitim verisini hazırlama Exercise 7: Uyumlu eğitim verileri Exercise 8: spaCy ile eğitim Exercise 9: Eğitime hazırlık adımları Exercise 10: Mevcut bir NER modelini eğit Exercise 11: Sıfırdan bir spaCy modeli eğitme Exercise 12: Kapanış