Stem dan lemma dari GoT
Dalam latihan ini, Anda diberikan beberapa kalimat dari Game of Thrones karya George R.R. Martin. Tugas Anda adalah membuat stem dan lemma dari string GoT yang diberikan.
Ingat bahwa stemming mengurangi kata ke akarnya, sedangkan lemmatization menghasilkan kata yang benar. Namun, kecepatan keduanya bisa sangat berbeda, dengan stemming jauh lebih cepat. Pada Langkah 2 dan 3, perhatikan total waktu yang dibutuhkan untuk setiap operasi. Kita menggunakan metode time.time() untuk mengukur waktu yang diperlukan untuk melakukan stemming dan lemmatization.
Latihan ini adalah bagian dari kursus
Analisis Sentimen dengan Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import the required packages from nltk
from nltk.stem import ____, ____
from nltk import word_tokenize
porter = PorterStemmer()
WNlemmatizer = WordNetLemmatizer()
# Tokenize the GoT string
tokens = ____(GoT)