Lematisasi
Saat melanjutkan analisis ulasan pengguna, Anda menyadari bahwa stemming kadang menghasilkan kata yang tidak baku seperti "fli" dari "flying", yang dapat menurunkan keterbacaan. Untuk mengatasinya, Anda akan menggunakan lematisasi, yang mengembalikan kata yang sebenarnya dan membantu meningkatkan kejelasan serta ketepatan analisis Anda.
WordNetLemmatizer telah diimpor, stop_words telah didefinisikan, dan sumber daya NLTK yang diperlukan telah diunduh.
Latihan ini adalah bagian dari kursus
Natural Language Processing (NLP) in Python
Petunjuk latihan
- Buat instans
lemmatizerdari kelasWordNetLemmatizer(). - Gunakan
lemmatizeruntuk melemmatisasilower_tokens.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
clean_tokens = ['flying', 'lot', 'lately', 'flights', 'keep', 'getting', 'delayed', 'honestly', 'traveling', 'work', 'gets', 'exhausting', 'endless', 'delays', 'every', 'travel', 'teaches', 'something', 'new']
# Create lemmatizer
lemmatizer = ____()
# Lemmatize each token
lemmatized_tokens = [____.____(____) for ____ in clean_tokens]
print(lemmatized_tokens)