Menghapus tanda baca
Setelah Anda menghapus stop word dari teks umpan balik, sekarang saatnya menangani tanda baca. Token yang Anda peroleh pada latihan sebelumnya masih mengandung tanda baca, yang sering kali tidak diperlukan saat mengategorikan umpan balik.
Tugas Anda adalah menghapus tanda baca dari daftar token yang disediakan untuk membantu membersihkan data lebih lanjut.
Latihan ini adalah bagian dari kursus
Natural Language Processing (NLP) in Python
Petunjuk latihan
- Bersihkan daftar
filtered_tokensdengan menghapus semua tanda baca.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
import string
filtered_tokens = ['reached', 'support', 'got', 'helpful', 'response', 'within', 'minutes', '!', '!', '!', '#', 'impressed']
# Remove punctuation
clean_tokens = [____ for word in filtered_tokens if ____ not in ____.____]
print(clean_tokens)