BaşlayınÜcretsiz başlayın

Stemming

review metnini temizleyip durak sözcükleri ve noktalama işaretlerini kaldırdığına göre, şimdi kalan sözcükleri köklerine indirgemek için stemming ile normalize etmeye hazırsın. Bu, benzer sözcükleri bir araya getirerek analizini daha tutarlı ve verimli hale getirir.

PorterStemmer sınıfı ve clean_tokens listesi sağlandı.

Bu egzersiz, kursun bir parçasıdır

Python ile Natural Language Processing (NLP)

Kursa Göz Atın

Egzersiz talimatları

  • PorterStemmer()'ı başlat.
  • clean_tokens listesindeki her bir token'ı kök haline getirmek için bir liste üreteci kullan.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

clean_tokens = ['flying', 'lot', 'lately', 'flights', 'keep', 'getting', 'delayed', 'honestly', 'traveling', 'work', 'gets', 'exhausting', 'endless', 'delays', 'every', 'travel', 'teaches', 'something', 'new']

# Create stemmer
stemmer = ____()

# Stem each token
stemmed_tokens = [____.____(____) for ____ in clean_tokens]

print(stemmed_tokens)
Kodu Düzenle ve Çalıştır