spaCy'de PhraseMatcher

Yapılandırılmamış metni işlerken, çoğu zaman taramak ve verilen metinlerde eşleştirmek istediğin uzun listeler ve sözlükler olur. Matcher kalıpları elle hazırlanır ve her bir belirtecin (token) tek tek kodlanması gerekir. Uzun bir ifade listen varsa, Matcher artık en iyi seçenek değildir. Bu durumda, PhraseMatcher sınıfı uzun sözlükleri eşleştirmemize yardımcı olur. Bu egzersizde, PhraseMatcher sınıfını kullanarak birden fazla terimle aynı şekle sahip kalıpları yakalamayı pratik edeceksin.

en_core_web_sm modeli halihazırda yüklü ve nlp olarak kullanıma hazır. PhraseMatcher sınıfı içe aktarılmış durumda. Kullanman için bir text dizgesi ve bir terms listesi mevcut.

Bu egzersiz, kursun bir parçasıdır

spaCy ile Natural Language Processing

Kursa Göz Atın

Egzersiz talimatları

Verilen terms öğelerinin şekliyle eşleşecek şekilde bir attr ile PhraseMatcher sınıfını başlat.
PhraseMatcher nesnesine eklenecek patterns listesini oluştur.
Verilen kalıplar için eşleşmeleri bul ve başlangıç ve bitiş belirteç indekslerini ve text içindeki eşleşen bölümü yazdır.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

text = "There are only a few acceptable IP addresse: (1) 127.100.0.1, (2) 123.4.1.0."
terms = ["110.0.0.0", "101.243.0.0"]

# Initialize a PhraseMatcher class to match to shapes of given terms
matcher = ____(nlp.____, attr = ____)

# Create patterns to add to the PhraseMatcher object
patterns = [nlp.make_doc(____) for term in terms]
matcher.____("IPAddresses", patterns)

# Find matches to the given patterns and print start and end characters and matches texts
doc = ____
matches = ____
for match_id, start, end in matches:
    print("Start token: ", ____, " | End token: ", ____, "| Matched text: ", doc[____:____].text)

Kodu Düzenle ve Çalıştır

Bu egzersiz, kursun bir parçasıdır

spaCy ile Natural Language Processing

IntermediárioNível de habilidade

4.8+

Kursa Ücretsiz Başla

Bu bölümde seni NLP’ye ve adlandırılmış varlık tanıma ile yapay zekâ destekli sohbet botları gibi bazı kullanım alanlarına girişle tanıştıracağız. Güçlü spaCy kütüphanesini kullanarak tokenizasyon, cümle bölütleme, POS etiketleme ve adlandırılmış varlık tanıma gibi çeşitli doğal dil işleme görevlerini nasıl yapacağını öğreneceksin.

Exercise 1: Doğal Dil İşleme (NLP) temelleri Exercise 2: spaCy'de Doc kapsayıcısı Exercise 3: NER kullanım durumu Exercise 4: spaCy ile Tokenization Exercise 5: spaCy temelleri Exercise 6: Bir spaCy işlem hattını çalıştırma Exercise 7: spaCy ile Lemmatization Exercise 8: spaCy ile cümle bölütleme Exercise 9: spaCy’de dilbilimsel özellikler Exercise 10: spaCy ile POS etiketleme Exercise 11: spaCy ile NER Exercise 12: spaCy ile metin işleme

Dilbilimsel özellikler, sözcük vektörleri, anlamsal benzerlik, benzetimler ve vektör işlemleri hakkında bilgi edin. Bu bölümde spaCy’yi kullanarak sözcük vektörlerini nasıl çıkaracağını, belirli bir konuya ilgili metinleri nasıl kategorize edeceğini ve bir derlemden ya da spaCy model söz varlığından verilen kelimelere anlamsal olarak benzer terimleri nasıl bulacağını keşfedeceksin.

Exercise 1: Dilbilimsel özellikler Exercise 2: spaCy’de dilbilimsel açıklamalar Exercise 3: spaCy ile sözcük anlamı ayrıştırma Exercise 4: spaCy ile bağımlılık çözümlemesi Exercise 5: Kelime vektörlerine giriş Exercise 6: spaCy söz varlığı Exercise 7: spaCy söz varlığında kelime vektörleri Exercise 8: Kelime vektörleri ve spaCy Exercise 9: Benzetimler ve vektör işlemleri Exercise 10: Kelime vektörlerinin izdüşümü Exercise 11: Bir sözlükte benzer kelimeler Exercise 12: spaCy ile anlamsal benzerliği ölçme Exercise 13: spaCy ile Doc benzerliği Exercise 14: spaCy ile Span benzerliği Exercise 15: Metin kategorize etmek için anlamsal benzerlik

spaCy işlem hattı bileşenlerine, yeni bir bileşenin nasıl ekleneceğine ve NLP işlem hattının nasıl analiz edileceğine alış. Ayrıca spaCy’deki EntityRuler, Matcher ve PhraseMatcher sınıfları ile Python’un RegEx paketi kullanılarak kural tabanlı bilgi çıkarımına yönelik birden çok yaklaşımı öğreneceksin.

Exercise 1: spaCy işlem hatları Exercise 2: spaCy'de pipe ekleme Exercise 3: spaCy'de boru hatlarını analiz etme Exercise 4: spaCy EntityRuler Exercise 5: Boş spaCy modeliyle EntityRuler Exercise 6: NER için EntityRuler Exercise 7: spaCy'de çoklu desenlerle EntityRuler Exercise 8: spaCy ile RegEx Exercise 9: Python'da RegEx Exercise 10: spaCy'de EntityRuler ile RegEx Exercise 11: spaCy Matcher ve PhraseMatcher Exercise 12: spaCy'de tek bir terimi eşleştirme Exercise 13: spaCy'de PhraseMatcher

Geçerli egzersiz

Exercise 14: spaCy'de genişletilmiş söz dizimiyle eşleştirme

spaCy modellerinin başarısız olabileceği çeşitli gerçek dünya kullanım durumlarını keşfet ve model performansını artırmak için onları nasıl daha ileri eğiteceğini öğren. spaCy eğitim adımlarına giriş yapacak, mevcut bir spaCy modelini ya da sıfırdan bir modeli nasıl eğiteceğini ve modeli çıkarım zamanında nasıl değerlendireceğini anlayacaksın.

Exercise 1: spaCy modellerini özelleştirme Exercise 2: spaCy modellerini eğitme Exercise 3: Verilerinde model performansı Exercise 4: spaCy eğitim veri biçimi Exercise 5: Eğitim adımları Exercise 6: Açıklama ve eğitim verisini hazırlama Exercise 7: Uyumlu eğitim verileri Exercise 8: spaCy ile eğitim Exercise 9: Eğitime hazırlık adımları Exercise 10: Mevcut bir NER modelini eğit Exercise 11: Sıfırdan bir spaCy modeli eğitme Exercise 12: Kapanış