BaşlayınÜcretsiz Başlayın

Eğitim verisi oluşturma (1)

spaCy'nin kural tabanlı Matcher aracı, adlandırılmış varlık modelleri için hızlıca eğitim verisi üretmenin harika bir yoludur. Cümlelerin bir listesi TEXTS değişkeni olarak sağlandı. İncelemek için IPython kabuğunda yazdırabilirsin. Farklı iPhone modellerine yapılan tüm atıfları bulmak istiyoruz ki bunları bir modelin 'GADGET' olarak tanımasını öğretecek eğitim verisine dönüştürelim.

nlp nesnesi senin için oluşturuldu ve Matcher da matcher değişkeni olarak hazır.

Bu egzersiz

spaCy ile İleri Düzey NLP

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Küçük harf biçimleri 'iphone' ve 'x' ile eşleşen iki token için bir desen yaz.
  • İki token için bir desen yaz: küçük harf biçimi 'iphone' ile eşleşen bir token ve '?' operatörünü kullanarak isteğe bağlı bir rakam.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Two tokens whose lowercase forms match 'iphone' and 'x'
pattern1 = [{____: ____}, {____: ____}]

# Token whose lowercase form matches 'iphone' and an optional digit
pattern2 = [{____: ____}, {____: ____, ___: ____}]

# Add patterns to the matcher
matcher.add('GADGET', None, pattern1, pattern2)
Kodu Düzenle ve Çalıştır