BaşlayınÜcretsiz Başlayın

spaCy ile Lemmatization

Bu egzersizde lemmatization uygulaması yapacaksın. Lemmatization, türetilmiş kelimelerin kök biçimini elde etmeye yardımcı olur. Yani herhangi bir cümlede, lemma sayısının belirteç (token) sayısından küçük veya ona eşit olmasını bekleriz.

İlk Amazon yiyecek incelemesi text adlı bir string olarak verildi. en_core_web_sm, nlp olarak yüklendi ve text üzerinde çalıştırılarak metin dizesi için bir Doc kapsayıcısı olan document oluşturuldu.

text için belirteçleri içeren bir liste olan tokens da kullanımın için hazırda yüklendi.

Bu egzersiz

spaCy ile Natural Language Processing

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • document içindeki tüm belirteçlerin lemmalarını listeye ekle ve ardından lemmas listesini yazdır.
  • tokens listesini yazdır ve tokens ile lemmas arasındaki farkları gözlemle.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

document = nlp(text)
tokens = [token.text for token in document]

# Append the lemma for all tokens in the document
lemmas = [token.____ for token in document]
print("Lemmas:\n", ____, "\n")

# Print tokens and compare with lemmas list
print("Tokens:\n", ____)
Kodu Düzenle ve Çalıştır