Eğitim verisi oluşturma (1)

spaCy'nin kural tabanlı Matcher aracı, adlandırılmış varlık modelleri için hızlıca eğitim verisi üretmenin harika bir yoludur. Cümlelerin bir listesi TEXTS değişkeni olarak sağlandı. İncelemek için IPython kabuğunda yazdırabilirsin. Farklı iPhone modellerine yapılan tüm atıfları bulmak istiyoruz ki bunları bir modelin 'GADGET' olarak tanımasını öğretecek eğitim verisine dönüştürelim.

nlp nesnesi senin için oluşturuldu ve Matcher da matcher değişkeni olarak hazır.

Bu egzersiz, kursun bir parçasıdır

spaCy ile İleri Düzey NLP

Kursa Göz Atın

Egzersiz talimatları

Küçük harf biçimleri 'iphone' ve 'x' ile eşleşen iki token için bir desen yaz.
İki token için bir desen yaz: küçük harf biçimi 'iphone' ile eşleşen bir token ve '?' operatörünü kullanarak isteğe bağlı bir rakam.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Two tokens whose lowercase forms match 'iphone' and 'x'
pattern1 = [{____: ____}, {____: ____}]

# Token whose lowercase form matches 'iphone' and an optional digit
pattern2 = [{____: ____}, {____: ____, ___: ____}]

# Add patterns to the matcher
matcher.add('GADGET', None, pattern1, pattern2)

Kodu Düzenle ve Çalıştır

Bu egzersiz, kursun bir parçasıdır

spaCy ile İleri Düzey NLP

IntermediárioNível de habilidade

4.7+

Kursa Ücretsiz Başla

Bu bölüm, spaCy ile metin işlemeye giriş yapmanı sağlayacak. Veri yapıları hakkında bilgi edinecek, istatistiksel modellerle nasıl çalışacağını ve bunları metnindeki dilbilimsel özellikleri tahmin etmek için nasıl kullanacağını öğreneceksin.

Exercise 1: spaCy'ye giriş Exercise 2: Başlarken Exercise 3: Belgeler, aralıklar ve belirteçler Exercise 4: Sözcüksel öznitelikler Exercise 5: İstatistiksel modeller Exercise 6: Model paketleri Exercise 7: Modelleri yükleme Exercise 8: Dilbilimsel açıklamaları tahmin etme Exercise 9: Bağlam içinde adlandırılmış varlıkları tahmin etme Exercise 10: Kural tabanlı eşleştirme Exercise 11: Matcher'ı kullanma Exercise 12: Eşleşme kalıpları yazma

Bu bölümde, yeni becerilerini kullanarak büyük miktarda metinden belirli bilgileri çıkaracaksın. spaCy'nin veri yapılarından en iyi şekilde nasıl yararlanacağını ve metin analizi için istatistiksel ve kural tabanlı yaklaşımları etkili biçimde nasıl birleştireceğini öğreneceksin.

Exercise 1: Veri Yapıları (1)Exercise 2: String'lerden hash'lere Exercise 3: Sözlük, hash’ler ve leksimler Exercise 4: Veri Yapıları (2)Exercise 5: Bir Doc oluşturma Exercise 6: Sıfırdan Doc, span ve varlıklar Exercise 7: Veri yapılarında en iyi uygulamalar Exercise 8: Sözcük vektörleri ve benzerlik Exercise 9: Sözcük vektörlerini inceleme Exercise 10: Benzerlikleri karşılaştırma Exercise 11: Modelleri ve kuralları birleştirme Exercise 12: Desenlerde hata ayıklama (1)Exercise 13: Desenleri hata ayıklama (2)Exercise 14: Verimli ifade eşleştirme Exercise 15: Ülkeleri ve ilişkileri çıkarmak

Bu bölüm, spaCy'nin işleme boru hattı hakkında bilmen gereken her şeyi gösterecek. Bir metni işlerken kaputun altında neler olduğunu, kendi bileşenlerini nasıl yazıp boru hattına ekleyeceğini ve belgelere (documents), aralıklara (spans) ve belirteçlere (tokens) kendi meta verilerini eklemek için özel öznitelikleri nasıl kullanacağını öğreneceksin.

Exercise 1: İşleme ardışık düzenleri Exercise 2: nlp'yi çağırdığında ne olur?Exercise 3: İşlem hattını inceleme Exercise 4: Özel boru hattı bileşenleri Exercise 5: Özel bileşenler için kullanım alanları Exercise 6: Basit bileşenler Exercise 7: Karmaşık bileşenler Exercise 8: Genişletme öznitelikleri Exercise 9: Uzantı özniteliklerini ayarlama (1)Exercise 10: Genişletme özniteliklerini ayarlama (2)Exercise 11: Varlıklar ve genişletmeler Exercise 12: Eklentili bileşenler Exercise 13: Ölçekleme ve performans Exercise 14: Akışları işleme Exercise 15: Bağlamla verileri işleme Exercise 16: Seçmeli işleme

Bu bölümde, spaCy'nin istatistiksel modellerini kullanım senaryona uyarlamak için nasıl güncelleyeceğini öğreneceksin – örneğin, çevrimiçi yorumlarda yeni bir varlık türünü tahmin etmek için. Baştan kendi eğitim döngünü yazacak, eğitimin temel mantığını anlayacak ve özel NLP projelerini daha başarılı kılabilecek ipuçları ve püf noktalarını öğreneceksin.

Exercise 1: Modelleri eğitme ve güncelleme Exercise 2: Eğitimin amacı Exercise 3: Eğitim verisi oluşturma (1)

Geçerli egzersiz

Exercise 4: Eğitim verisi oluşturma (2)Exercise 5: Eğitim döngüsü Exercise 6: Boru hattını kurma Exercise 7: Bir eğitim döngüsü oluşturma Exercise 8: Modeli keşfetmek Exercise 9: Eğitim için en iyi uygulamalar Exercise 10: İyi veri vs. kötü veri Exercise 11: Birden çok etiketle eğitim Exercise 12: Kapanış