BaşlayınÜcretsiz Başlayın

spaCy ile metin işleme

Her NLP uygulaması birkaç metin işleme adımından oluşur. Bunlardan bazılarını zaten öğrendin: tokenization, lemmatization, cümle bölütleme ve adlandırılmış varlık tanıma.

spaCy NLP Pipeline

Bu egzersizde, metni cümlelere ayırma ve adlandırılmış varlıkları çıkarma gibi spaCy’deki metin işleme adımlarını pratik etmeye devam edeceksin. Bu egzersiz için Amazon Fine Food Reviews veri kümesinden ilk beş yorumu kullanacaksın. Bu yorumlara texts nesnesi ile erişebilirsin.

en_core_web_sm modeli senin için yüklendi ve nlp ile erişebilirsin. texts içindeki her öğe için Doc kaplarından oluşan liste de önceden yüklendi ve documents üzerinden erişilebilir.

Bu egzersiz

spaCy ile Natural Language Processing

kursunun bir parçasıdır
Kursu Görüntüle

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Create a list to store sentences of each Doc container in documents
sentences = [[____ for sent in doc.____] for doc in documents]

# Print number of sentences in each Doc container in documents
num_sentences = [len(____) for s in sentences]
print("Number of sentences in documents:\n", ____)
Kodu Düzenle ve Çalıştır