BaşlayınÜcretsiz Başlayın

Durdurma sözcüklerini kaldırma

"ürün sorunları", "hizmet sorunları" ve "öneriler" gibi kategorilere kullanıcı geri bildirimlerini sınıflandırmayı hedefleyen bir projede çalışıyorsun. Çoğu zaman durdurma sözcükleri kategorileri ayırt etmede pek anlam taşımaz. Görevin, bu durdurma sözcüklerini kaldırarak, geri bildirimi daha sonra doğru başlıklara ayıracak bir makinenin işine yarayacak önemli sözcüklere odaklanmak.

nltk.tokenize içindeki word_tokenize ve nltk.corpus içindeki stopwords.words işlevleri senin için içe aktarıldı. Ayrıca, NLTK kaynakları punkt_tab ve stopwords önceden indirildi.

Bu egzersiz

Python ile Natural Language Processing (NLP)

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Verilen geri bildirimi sözcüklere ayır.
  • İngilizce durdurma sözcükleri listesini al.
  • İngilizce durdurma sözcüklerini kaldır ve sonucu filtered_tokens içinde kaydet.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

feedback = "I reached out to support and got a helpful response within minutes!!! Very #impressed"

# Tokenize the text
tokens = word_tokenize(____)

# Get the list of English stop words
stop_words = stopwords.____('____')

# Remove stop words 
filtered_tokens = [____ for word in tokens if ____.lower() not in ____]

print(filtered_tokens)
Kodu Düzenle ve Çalıştır