MulaiMulai sekarang secara gratis

Stemming

Sekarang setelah Anda membersihkan teks review dan menghapus stop word serta tanda baca, Anda siap menormalkan kata-kata yang tersisa menggunakan stemming untuk mereduksi kata ke bentuk dasarnya. Ini membantu mengelompokkan kata-kata serupa, sehingga analisis Anda menjadi lebih konsisten dan efisien.

Kelas PorterStemmer telah disediakan, bersama dengan daftar clean_tokens.

Latihan ini adalah bagian dari kursus

Natural Language Processing (NLP) in Python

Lihat Kursus

Petunjuk latihan

  • Inisialisasi PorterStemmer().
  • Gunakan list comprehension untuk melakukan stemming pada setiap token dari daftar clean_tokens.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

clean_tokens = ['flying', 'lot', 'lately', 'flights', 'keep', 'getting', 'delayed', 'honestly', 'traveling', 'work', 'gets', 'exhausting', 'endless', 'delays', 'every', 'travel', 'teaches', 'something', 'new']

# Create stemmer
stemmer = ____()

# Stem each token
stemmed_tokens = [____.____(____) for ____ in clean_tokens]

print(stemmed_tokens)
Edit dan Jalankan Kode