Durdurma sözcüklerini kaldırma
"ürün sorunları", "hizmet sorunları" ve "öneriler" gibi kategorilere kullanıcı geri bildirimlerini sınıflandırmayı hedefleyen bir projede çalışıyorsun. Çoğu zaman durdurma sözcükleri kategorileri ayırt etmede pek anlam taşımaz. Görevin, bu durdurma sözcüklerini kaldırarak, geri bildirimi daha sonra doğru başlıklara ayıracak bir makinenin işine yarayacak önemli sözcüklere odaklanmak.
nltk.tokenize içindeki word_tokenize ve nltk.corpus içindeki stopwords.words işlevleri senin için içe aktarıldı. Ayrıca, NLTK kaynakları punkt_tab ve stopwords önceden indirildi.
Bu egzersiz
Python ile Natural Language Processing (NLP)
kursunun bir parçasıdırEgzersiz talimatları
- Verilen geri bildirimi sözcüklere ayır.
- İngilizce durdurma sözcükleri listesini al.
- İngilizce durdurma sözcüklerini kaldır ve sonucu
filtered_tokensiçinde kaydet.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
feedback = "I reached out to support and got a helpful response within minutes!!! Very #impressed"
# Tokenize the text
tokens = word_tokenize(____)
# Get the list of English stop words
stop_words = stopwords.____('____')
# Remove stop words
filtered_tokens = [____ for word in tokens if ____.lower() not in ____]
print(filtered_tokens)