spaCy ile Lemmatization
Bu egzersizde lemmatization uygulaması yapacaksın. Lemmatization, türetilmiş kelimelerin kök biçimini elde etmeye yardımcı olur. Yani herhangi bir cümlede, lemma sayısının belirteç (token) sayısından küçük veya ona eşit olmasını bekleriz.
İlk Amazon yiyecek incelemesi text adlı bir string olarak verildi. en_core_web_sm, nlp olarak yüklendi ve text üzerinde çalıştırılarak metin dizesi için bir Doc kapsayıcısı olan document oluşturuldu.
text için belirteçleri içeren bir liste olan tokens da kullanımın için hazırda yüklendi.
Bu egzersiz, kursun bir parçasıdır
spaCy ile Natural Language Processing
Egzersiz talimatları
documentiçindeki tüm belirteçlerin lemmalarını listeye ekle ve ardındanlemmaslistesini yazdır.tokenslistesini yazdır vetokensilelemmasarasındaki farkları gözlemle.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
document = nlp(text)
tokens = [token.text for token in document]
# Append the lemma for all tokens in the document
lemmas = [token.____ for token in document]
print("Lemmas:\n", ____, "\n")
# Print tokens and compare with lemmas list
print("Tokens:\n", ____)