spaCy'de pipe ekleme

Farklı NLP görevleri için genellikle mevcut bir spaCy modelini kullanırsın. Ancak bazı durumlarda, cümle bölütleme gibi hazır bir işlem hattı bileşeni beklenen sonuçları üretmek için uzun süre alabilir. Bu egzersizde, bir spaCy modeline (metin işleme işlem hattına) bir bileşen eklemeyi pratik yapacaksın.

Bu egzersizde Amazon Fine Food Reviews veri kümesinden ilk beş incelemeyi kullanacaksın. Bu incelemelere texts dizesini kullanarak erişebilirsin.

spaCy paketi senin için zaten içe aktarılmış durumda.

Bu egzersiz, kursun bir parçasıdır

spaCy ile Natural Language Processing

Kursa Göz Atın

Egzersiz talimatları

Boş bir spaCy İngilizce modeli yükle ve modele bir sentencizer bileşeni ekle.
texts için bir Doc kapsayıcısı oluştur, verilen belgenin sentences listesini oluştur ve cümle sayısını yazdır.
sentences listesindeki ikinci cümlenin token listesini yazdır.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Load a blank spaCy English model and add a sentencizer component
nlp = spacy.____("en")
nlp.____("sentencizer")

# Create Doc containers, store sentences and print its number of sentences
doc = ____
sentences = [____ for s in ____]
print("Number of sentences: ", len(____), "\n")

# Print the list of tokens in the second sentence
print("Second sentence tokens: ", [____ for ____ in sentences[1]])

Kodu Düzenle ve Çalıştır

Bu egzersiz, kursun bir parçasıdır

spaCy ile Natural Language Processing

IntermediárioNível de habilidade

4.8+

Kursa Ücretsiz Başla

Bu bölümde seni NLP’ye ve adlandırılmış varlık tanıma ile yapay zekâ destekli sohbet botları gibi bazı kullanım alanlarına girişle tanıştıracağız. Güçlü spaCy kütüphanesini kullanarak tokenizasyon, cümle bölütleme, POS etiketleme ve adlandırılmış varlık tanıma gibi çeşitli doğal dil işleme görevlerini nasıl yapacağını öğreneceksin.

Exercise 1: Doğal Dil İşleme (NLP) temelleri Exercise 2: spaCy'de Doc kapsayıcısı Exercise 3: NER kullanım durumu Exercise 4: spaCy ile Tokenization Exercise 5: spaCy temelleri Exercise 6: Bir spaCy işlem hattını çalıştırma Exercise 7: spaCy ile Lemmatization Exercise 8: spaCy ile cümle bölütleme Exercise 9: spaCy’de dilbilimsel özellikler Exercise 10: spaCy ile POS etiketleme Exercise 11: spaCy ile NER Exercise 12: spaCy ile metin işleme

Dilbilimsel özellikler, sözcük vektörleri, anlamsal benzerlik, benzetimler ve vektör işlemleri hakkında bilgi edin. Bu bölümde spaCy’yi kullanarak sözcük vektörlerini nasıl çıkaracağını, belirli bir konuya ilgili metinleri nasıl kategorize edeceğini ve bir derlemden ya da spaCy model söz varlığından verilen kelimelere anlamsal olarak benzer terimleri nasıl bulacağını keşfedeceksin.

Exercise 1: Dilbilimsel özellikler Exercise 2: spaCy’de dilbilimsel açıklamalar Exercise 3: spaCy ile sözcük anlamı ayrıştırma Exercise 4: spaCy ile bağımlılık çözümlemesi Exercise 5: Kelime vektörlerine giriş Exercise 6: spaCy söz varlığı Exercise 7: spaCy söz varlığında kelime vektörleri Exercise 8: Kelime vektörleri ve spaCy Exercise 9: Benzetimler ve vektör işlemleri Exercise 10: Kelime vektörlerinin izdüşümü Exercise 11: Bir sözlükte benzer kelimeler Exercise 12: spaCy ile anlamsal benzerliği ölçme Exercise 13: spaCy ile Doc benzerliği Exercise 14: spaCy ile Span benzerliği Exercise 15: Metin kategorize etmek için anlamsal benzerlik

spaCy işlem hattı bileşenlerine, yeni bir bileşenin nasıl ekleneceğine ve NLP işlem hattının nasıl analiz edileceğine alış. Ayrıca spaCy’deki EntityRuler, Matcher ve PhraseMatcher sınıfları ile Python’un RegEx paketi kullanılarak kural tabanlı bilgi çıkarımına yönelik birden çok yaklaşımı öğreneceksin.

Exercise 1: spaCy işlem hatları Exercise 2: spaCy'de pipe ekleme

Geçerli egzersiz

Exercise 3: spaCy'de boru hatlarını analiz etme Exercise 4: spaCy EntityRuler Exercise 5: Boş spaCy modeliyle EntityRuler Exercise 6: NER için EntityRuler Exercise 7: spaCy'de çoklu desenlerle EntityRuler Exercise 8: spaCy ile RegEx Exercise 9: Python'da RegEx Exercise 10: spaCy'de EntityRuler ile RegEx Exercise 11: spaCy Matcher ve PhraseMatcher Exercise 12: spaCy'de tek bir terimi eşleştirme Exercise 13: spaCy'de PhraseMatcher Exercise 14: spaCy'de genişletilmiş söz dizimiyle eşleştirme

spaCy modellerinin başarısız olabileceği çeşitli gerçek dünya kullanım durumlarını keşfet ve model performansını artırmak için onları nasıl daha ileri eğiteceğini öğren. spaCy eğitim adımlarına giriş yapacak, mevcut bir spaCy modelini ya da sıfırdan bir modeli nasıl eğiteceğini ve modeli çıkarım zamanında nasıl değerlendireceğini anlayacaksın.

Exercise 1: spaCy modellerini özelleştirme Exercise 2: spaCy modellerini eğitme Exercise 3: Verilerinde model performansı Exercise 4: spaCy eğitim veri biçimi Exercise 5: Eğitim adımları Exercise 6: Açıklama ve eğitim verisini hazırlama Exercise 7: Uyumlu eğitim verileri Exercise 8: spaCy ile eğitim Exercise 9: Eğitime hazırlık adımları Exercise 10: Mevcut bir NER modelini eğit Exercise 11: Sıfırdan bir spaCy modeli eğitme Exercise 12: Kapanış