Stemming
review metnini temizleyip durak sözcükleri ve noktalama işaretlerini kaldırdığına göre, şimdi kalan sözcükleri köklerine indirgemek için stemming ile normalize etmeye hazırsın. Bu, benzer sözcükleri bir araya getirerek analizini daha tutarlı ve verimli hale getirir.
PorterStemmer sınıfı ve clean_tokens listesi sağlandı.
Bu egzersiz, kursun bir parçasıdır
Python ile Natural Language Processing (NLP)
Egzersiz talimatları
PorterStemmer()'ı başlat.clean_tokenslistesindeki her bir token'ı kök haline getirmek için bir liste üreteci kullan.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
clean_tokens = ['flying', 'lot', 'lately', 'flights', 'keep', 'getting', 'delayed', 'honestly', 'traveling', 'work', 'gets', 'exhausting', 'endless', 'delays', 'every', 'travel', 'teaches', 'something', 'new']
# Create stemmer
stemmer = ____()
# Stem each token
stemmed_tokens = [____.____(____) for ____ in clean_tokens]
print(stemmed_tokens)