Durdurma sözcüklerini kaldırma
"ürün sorunları", "hizmet sorunları" ve "öneriler" gibi kategorilere kullanıcı geri bildirimlerini sınıflandırmayı hedefleyen bir projede çalışıyorsun. Çoğu zaman durdurma sözcükleri kategorileri ayırt etmede pek anlam taşımaz. Görevin, bu durdurma sözcüklerini kaldırarak, geri bildirimi daha sonra doğru başlıklara ayıracak bir makinenin işine yarayacak önemli sözcüklere odaklanmak.
nltk.tokenize içindeki word_tokenize ve nltk.corpus içindeki stopwords.words işlevleri senin için içe aktarıldı. Ayrıca, NLTK kaynakları punkt_tab ve stopwords önceden indirildi.
Bu egzersiz, kursun bir parçasıdır
Python ile Natural Language Processing (NLP)
Egzersiz talimatları
- Verilen geri bildirimi sözcüklere ayır.
- İngilizce durdurma sözcükleri listesini al.
- İngilizce durdurma sözcüklerini kaldır ve sonucu
filtered_tokensiçinde kaydet.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
feedback = "I reached out to support and got a helpful response within minutes!!! Very #impressed"
# Tokenize the text
tokens = word_tokenize(____)
# Get the list of English stop words
stop_words = stopwords.____('____')
# Remove stop words
filtered_tokens = [____ for word in tokens if ____.lower() not in ____]
print(filtered_tokens)