spaCy ile metin işleme
Her NLP uygulaması birkaç metin işleme adımından oluşur. Bunlardan bazılarını zaten öğrendin: tokenization, lemmatization, cümle bölütleme ve adlandırılmış varlık tanıma.
Bu egzersizde, metni cümlelere ayırma ve adlandırılmış varlıkları çıkarma gibi spaCy’deki metin işleme adımlarını pratik etmeye devam edeceksin. Bu egzersiz için Amazon Fine Food Reviews veri kümesinden ilk beş yorumu kullanacaksın. Bu yorumlara texts nesnesi ile erişebilirsin.
en_core_web_sm modeli senin için yüklendi ve nlp ile erişebilirsin. texts içindeki her öğe için Doc kaplarından oluşan liste de önceden yüklendi ve documents üzerinden erişilebilir.
Bu egzersiz
spaCy ile Natural Language Processing
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create a list to store sentences of each Doc container in documents
sentences = [[____ for sent in doc.____] for doc in documents]
# Print number of sentences in each Doc container in documents
num_sentences = [len(____) for s in sentences]
print("Number of sentences in documents:\n", ____)