Stemming
Sekarang setelah Anda membersihkan teks review dan menghapus stop word serta tanda baca, Anda siap menormalkan kata-kata yang tersisa menggunakan stemming untuk mereduksi kata ke bentuk dasarnya. Ini membantu mengelompokkan kata-kata serupa, sehingga analisis Anda menjadi lebih konsisten dan efisien.
Kelas PorterStemmer telah disediakan, bersama dengan daftar clean_tokens.
Latihan ini adalah bagian dari kursus
Natural Language Processing (NLP) in Python
Petunjuk latihan
- Inisialisasi
PorterStemmer(). - Gunakan list comprehension untuk melakukan stemming pada setiap token dari daftar
clean_tokens.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
clean_tokens = ['flying', 'lot', 'lately', 'flights', 'keep', 'getting', 'delayed', 'honestly', 'traveling', 'work', 'gets', 'exhausting', 'endless', 'delays', 'every', 'travel', 'teaches', 'something', 'new']
# Create stemmer
stemmer = ____()
# Stem each token
stemmed_tokens = [____.____(____) for ____ in clean_tokens]
print(stemmed_tokens)