BaşlayınÜcretsiz başlayın

spaCy ile metin işleme

Her NLP uygulaması birkaç metin işleme adımından oluşur. Bunlardan bazılarını zaten öğrendin: tokenization, lemmatization, cümle bölütleme ve adlandırılmış varlık tanıma.

spaCy NLP Pipeline

Bu egzersizde, metni cümlelere ayırma ve adlandırılmış varlıkları çıkarma gibi spaCy’deki metin işleme adımlarını pratik etmeye devam edeceksin. Bu egzersiz için Amazon Fine Food Reviews veri kümesinden ilk beş yorumu kullanacaksın. Bu yorumlara texts nesnesi ile erişebilirsin.

en_core_web_sm modeli senin için yüklendi ve nlp ile erişebilirsin. texts içindeki her öğe için Doc kaplarından oluşan liste de önceden yüklendi ve documents üzerinden erişilebilir.

Bu egzersiz, kursun bir parçasıdır

spaCy ile Natural Language Processing

Kursa Göz Atın

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Create a list to store sentences of each Doc container in documents
sentences = [[____ for sent in doc.____] for doc in documents]

# Print number of sentences in each Doc container in documents
num_sentences = [len(____) for s in sentences]
print("Number of sentences in documents:\n", ____)
Kodu Düzenle ve Çalıştır