Noktalama işaretlerini kaldırma
Artık geri bildirim metninden durak (stop) sözcükleri kaldırdığına göre, sıra noktalama işaretlerini ele almaya geldi. Bir önceki egzersizde elde ettiğin belirteçlerde hâlâ noktalama işaretleri var ve bunlar geri bildirimi kategorize ederken genellikle gereksizdir.
Görevin, verilen belirteç listesinden noktalama işaretlerini kaldırarak veriyi daha da temizlemek.
Bu egzersiz, kursun bir parçasıdır
Python ile Natural Language Processing (NLP)
Egzersiz talimatları
- Tüm noktalama işaretlerini kaldırarak
filtered_tokenslistesini temizle.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
import string
filtered_tokens = ['reached', 'support', 'got', 'helpful', 'response', 'within', 'minutes', '!', '!', '!', '#', 'impressed']
# Remove punctuation
clean_tokens = [____ for word in filtered_tokens if ____ not in ____.____]
print(clean_tokens)