BaşlayınÜcretsiz başlayın

Durdurma sözcüklerini kaldırma

"ürün sorunları", "hizmet sorunları" ve "öneriler" gibi kategorilere kullanıcı geri bildirimlerini sınıflandırmayı hedefleyen bir projede çalışıyorsun. Çoğu zaman durdurma sözcükleri kategorileri ayırt etmede pek anlam taşımaz. Görevin, bu durdurma sözcüklerini kaldırarak, geri bildirimi daha sonra doğru başlıklara ayıracak bir makinenin işine yarayacak önemli sözcüklere odaklanmak.

nltk.tokenize içindeki word_tokenize ve nltk.corpus içindeki stopwords.words işlevleri senin için içe aktarıldı. Ayrıca, NLTK kaynakları punkt_tab ve stopwords önceden indirildi.

Bu egzersiz, kursun bir parçasıdır

Python ile Natural Language Processing (NLP)

Kursa Göz Atın

Egzersiz talimatları

  • Verilen geri bildirimi sözcüklere ayır.
  • İngilizce durdurma sözcükleri listesini al.
  • İngilizce durdurma sözcüklerini kaldır ve sonucu filtered_tokens içinde kaydet.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

feedback = "I reached out to support and got a helpful response within minutes!!! Very #impressed"

# Tokenize the text
tokens = word_tokenize(____)

# Get the list of English stop words
stop_words = stopwords.____('____')

# Remove stop words 
filtered_tokens = [____ for word in tokens if ____.lower() not in ____]

print(filtered_tokens)
Kodu Düzenle ve Çalıştır