Stemming
review metnini temizleyip durak sözcükleri ve noktalama işaretlerini kaldırdığına göre, şimdi kalan sözcükleri köklerine indirgemek için stemming ile normalize etmeye hazırsın. Bu, benzer sözcükleri bir araya getirerek analizini daha tutarlı ve verimli hale getirir.
PorterStemmer sınıfı ve clean_tokens listesi sağlandı.
Bu egzersiz
Python ile Natural Language Processing (NLP)
kursunun bir parçasıdırEgzersiz talimatları
PorterStemmer()'ı başlat.clean_tokenslistesindeki her bir token'ı kök haline getirmek için bir liste üreteci kullan.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
clean_tokens = ['flying', 'lot', 'lately', 'flights', 'keep', 'getting', 'delayed', 'honestly', 'traveling', 'work', 'gets', 'exhausting', 'endless', 'delays', 'every', 'travel', 'teaches', 'something', 'new']
# Create stemmer
stemmer = ____()
# Stem each token
stemmed_tokens = [____.____(____) for ____ in clean_tokens]
print(stemmed_tokens)