Verimli ifade eşleştirme

Bazen tek tek token'ları tanımlayan kalıplar yazmak yerine, tam dizeleri (string) eşleştirmek daha verimlidir. Bu özellikle de sonlu kategoriler için geçerlidir – örneğin dünyadaki tüm ülkeler gibi.

Halihazırda bir ülke listemiz var, bu yüzden bunu bilgi çıkarma betiğimizin temeli olarak kullanalım. Dize adlarının bulunduğu bir liste COUNTRIES değişkeni olarak mevcut. nlp nesnesi ve bir test doc zaten oluşturuldu ve doc.text kabuğa yazdırıldı.

Bu egzersiz, kursun bir parçasıdır

spaCy ile İleri Düzey NLP

Kursa Göz Atın

Egzersiz talimatları

PhraseMatcher'ı içe aktar ve paylaşılan vocab ile başlatıp matcher değişkenine ata.
İfade kalıplarını ekle ve eşleştiriciyi (matcher) doc üzerinde çağır.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Import the PhraseMatcher and initialize it
from spacy.____ import ____
matcher = ____(____)

# Create pattern Doc objects and add them to the matcher
# This is the faster version of: [nlp(country) for country in COUNTRIES]
patterns = list(nlp.pipe(COUNTRIES))
matcher.add('COUNTRY', None, *patterns)

# Call the matcher on the test document and print the result
matches = ____(____)
print([doc[start:end] for match_id, start, end in matches])

Kodu Düzenle ve Çalıştır

Bu egzersiz, kursun bir parçasıdır

spaCy ile İleri Düzey NLP

IntermediárioNível de habilidade

4.7+

Kursa Ücretsiz Başla

Bu bölüm, spaCy ile metin işlemeye giriş yapmanı sağlayacak. Veri yapıları hakkında bilgi edinecek, istatistiksel modellerle nasıl çalışacağını ve bunları metnindeki dilbilimsel özellikleri tahmin etmek için nasıl kullanacağını öğreneceksin.

Exercise 1: spaCy'ye giriş Exercise 2: Başlarken Exercise 3: Belgeler, aralıklar ve belirteçler Exercise 4: Sözcüksel öznitelikler Exercise 5: İstatistiksel modeller Exercise 6: Model paketleri Exercise 7: Modelleri yükleme Exercise 8: Dilbilimsel açıklamaları tahmin etme Exercise 9: Bağlam içinde adlandırılmış varlıkları tahmin etme Exercise 10: Kural tabanlı eşleştirme Exercise 11: Matcher'ı kullanma Exercise 12: Eşleşme kalıpları yazma

Bu bölümde, yeni becerilerini kullanarak büyük miktarda metinden belirli bilgileri çıkaracaksın. spaCy'nin veri yapılarından en iyi şekilde nasıl yararlanacağını ve metin analizi için istatistiksel ve kural tabanlı yaklaşımları etkili biçimde nasıl birleştireceğini öğreneceksin.

Exercise 1: Veri Yapıları (1)Exercise 2: String'lerden hash'lere Exercise 3: Sözlük, hash’ler ve leksimler Exercise 4: Veri Yapıları (2)Exercise 5: Bir Doc oluşturma Exercise 6: Sıfırdan Doc, span ve varlıklar Exercise 7: Veri yapılarında en iyi uygulamalar Exercise 8: Sözcük vektörleri ve benzerlik Exercise 9: Sözcük vektörlerini inceleme Exercise 10: Benzerlikleri karşılaştırma Exercise 11: Modelleri ve kuralları birleştirme Exercise 12: Desenlerde hata ayıklama (1)Exercise 13: Desenleri hata ayıklama (2)Exercise 14: Verimli ifade eşleştirme

Geçerli egzersiz

Exercise 15: Ülkeleri ve ilişkileri çıkarmak

Bu bölüm, spaCy'nin işleme boru hattı hakkında bilmen gereken her şeyi gösterecek. Bir metni işlerken kaputun altında neler olduğunu, kendi bileşenlerini nasıl yazıp boru hattına ekleyeceğini ve belgelere (documents), aralıklara (spans) ve belirteçlere (tokens) kendi meta verilerini eklemek için özel öznitelikleri nasıl kullanacağını öğreneceksin.

Exercise 1: İşleme ardışık düzenleri Exercise 2: nlp'yi çağırdığında ne olur?Exercise 3: İşlem hattını inceleme Exercise 4: Özel boru hattı bileşenleri Exercise 5: Özel bileşenler için kullanım alanları Exercise 6: Basit bileşenler Exercise 7: Karmaşık bileşenler Exercise 8: Genişletme öznitelikleri Exercise 9: Uzantı özniteliklerini ayarlama (1)Exercise 10: Genişletme özniteliklerini ayarlama (2)Exercise 11: Varlıklar ve genişletmeler Exercise 12: Eklentili bileşenler Exercise 13: Ölçekleme ve performans Exercise 14: Akışları işleme Exercise 15: Bağlamla verileri işleme Exercise 16: Seçmeli işleme

Bu bölümde, spaCy'nin istatistiksel modellerini kullanım senaryona uyarlamak için nasıl güncelleyeceğini öğreneceksin – örneğin, çevrimiçi yorumlarda yeni bir varlık türünü tahmin etmek için. Baştan kendi eğitim döngünü yazacak, eğitimin temel mantığını anlayacak ve özel NLP projelerini daha başarılı kılabilecek ipuçları ve püf noktalarını öğreneceksin.

Exercise 1: Modelleri eğitme ve güncelleme Exercise 2: Eğitimin amacı Exercise 3: Eğitim verisi oluşturma (1)Exercise 4: Eğitim verisi oluşturma (2)Exercise 5: Eğitim döngüsü Exercise 6: Boru hattını kurma Exercise 7: Bir eğitim döngüsü oluşturma Exercise 8: Modeli keşfetmek Exercise 9: Eğitim için en iyi uygulamalar Exercise 10: İyi veri vs. kötü veri Exercise 11: Birden çok etiketle eğitim Exercise 12: Kapanış