BaşlayınÜcretsiz başlayın

Eğitim verisi oluşturma (1)

spaCy'nin kural tabanlı Matcher aracı, adlandırılmış varlık modelleri için hızlıca eğitim verisi üretmenin harika bir yoludur. Cümlelerin bir listesi TEXTS değişkeni olarak sağlandı. İncelemek için IPython kabuğunda yazdırabilirsin. Farklı iPhone modellerine yapılan tüm atıfları bulmak istiyoruz ki bunları bir modelin 'GADGET' olarak tanımasını öğretecek eğitim verisine dönüştürelim.

nlp nesnesi senin için oluşturuldu ve Matcher da matcher değişkeni olarak hazır.

Bu egzersiz, kursun bir parçasıdır

spaCy ile İleri Düzey NLP

Kursa Göz Atın

Egzersiz talimatları

  • Küçük harf biçimleri 'iphone' ve 'x' ile eşleşen iki token için bir desen yaz.
  • İki token için bir desen yaz: küçük harf biçimi 'iphone' ile eşleşen bir token ve '?' operatörünü kullanarak isteğe bağlı bir rakam.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Two tokens whose lowercase forms match 'iphone' and 'x'
pattern1 = [{____: ____}, {____: ____}]

# Token whose lowercase form matches 'iphone' and an optional digit
pattern2 = [{____: ____}, {____: ____, ___: ____}]

# Add patterns to the matcher
matcher.add('GADGET', None, pattern1, pattern2)
Kodu Düzenle ve Çalıştır