spaCy'de pipe ekleme
Farklı NLP görevleri için genellikle mevcut bir spaCy modelini kullanırsın. Ancak bazı durumlarda, cümle bölütleme gibi hazır bir işlem hattı bileşeni beklenen sonuçları üretmek için uzun süre alabilir. Bu egzersizde, bir spaCy modeline (metin işleme işlem hattına) bir bileşen eklemeyi pratik yapacaksın.
Bu egzersizde Amazon Fine Food Reviews veri kümesinden ilk beş incelemeyi kullanacaksın. Bu incelemelere texts dizesini kullanarak erişebilirsin.
spaCy paketi senin için zaten içe aktarılmış durumda.
Bu egzersiz
spaCy ile Natural Language Processing
kursunun bir parçasıdırEgzersiz talimatları
- Boş bir
spaCyİngilizce modeli yükle ve modele birsentencizerbileşeni ekle. textsiçin birDockapsayıcısı oluştur, verilen belgeninsentenceslistesini oluştur ve cümle sayısını yazdır.sentenceslistesindeki ikinci cümlenin token listesini yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Load a blank spaCy English model and add a sentencizer component
nlp = spacy.____("en")
nlp.____("sentencizer")
# Create Doc containers, store sentences and print its number of sentences
doc = ____
sentences = [____ for s in ____]
print("Number of sentences: ", len(____), "\n")
# Print the list of tokens in the second sentence
print("Second sentence tokens: ", [____ for ____ in sentences[1]])