Menghapus tanda baca
Setelah Anda menghapus stop word dari teks umpan balik, sekarang saatnya menangani tanda baca. Token yang Anda peroleh pada latihan sebelumnya masih mengandung tanda baca, yang sering kali tidak diperlukan saat mengategorikan umpan balik.
Tugas Anda adalah menghapus tanda baca dari daftar token yang disediakan untuk membantu membersihkan data lebih lanjut.
Latihan ini merupakan bagian dari kursus
Natural Language Processing (NLP) in Python
Instruksi latihan
- Bersihkan daftar
filtered_tokensdengan menghapus semua tanda baca.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
import string
filtered_tokens = ['reached', 'support', 'got', 'helpful', 'response', 'within', 'minutes', '!', '!', '!', '#', 'impressed']
# Remove punctuation
clean_tokens = [____ for word in filtered_tokens if ____ not in ____.____]
print(clean_tokens)