MulaiMulai sekarang secara gratis

Lematisasi

Saat melanjutkan analisis ulasan pengguna, Anda menyadari bahwa stemming kadang menghasilkan kata yang tidak baku seperti "fli" dari "flying", yang dapat menurunkan keterbacaan. Untuk mengatasinya, Anda akan menggunakan lematisasi, yang mengembalikan kata yang sebenarnya dan membantu meningkatkan kejelasan serta ketepatan analisis Anda.

WordNetLemmatizer telah diimpor, stop_words telah didefinisikan, dan sumber daya NLTK yang diperlukan telah diunduh.

Latihan ini adalah bagian dari kursus

Natural Language Processing (NLP) in Python

Lihat Kursus

Petunjuk latihan

  • Buat instans lemmatizer dari kelas WordNetLemmatizer().
  • Gunakan lemmatizer untuk melemmatisasi lower_tokens.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

clean_tokens = ['flying', 'lot', 'lately', 'flights', 'keep', 'getting', 'delayed', 'honestly', 'traveling', 'work', 'gets', 'exhausting', 'endless', 'delays', 'every', 'travel', 'teaches', 'something', 'new']

# Create lemmatizer
lemmatizer = ____()

# Lemmatize each token
lemmatized_tokens = [____.____(____) for ____ in clean_tokens]

print(lemmatized_tokens)
Edit dan Jalankan Kode