BaşlayınÜcretsiz Başlayın

Stemming

review metnini temizleyip durak sözcükleri ve noktalama işaretlerini kaldırdığına göre, şimdi kalan sözcükleri köklerine indirgemek için stemming ile normalize etmeye hazırsın. Bu, benzer sözcükleri bir araya getirerek analizini daha tutarlı ve verimli hale getirir.

PorterStemmer sınıfı ve clean_tokens listesi sağlandı.

Bu egzersiz

Python ile Natural Language Processing (NLP)

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • PorterStemmer()'ı başlat.
  • clean_tokens listesindeki her bir token'ı kök haline getirmek için bir liste üreteci kullan.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

clean_tokens = ['flying', 'lot', 'lately', 'flights', 'keep', 'getting', 'delayed', 'honestly', 'traveling', 'work', 'gets', 'exhausting', 'endless', 'delays', 'every', 'travel', 'teaches', 'something', 'new']

# Create stemmer
stemmer = ____()

# Stem each token
stemmed_tokens = [____.____(____) for ____ in clean_tokens]

print(stemmed_tokens)
Kodu Düzenle ve Çalıştır