Stem dari tweet
Dalam latihan ini, Anda akan bekerja dengan array bernama tweets. Array ini berisi teks data sentimen maskapai yang dikumpulkan dari Twitter.
Tugas Anda adalah memproses array ini dan mengubahnya menjadi daftar token menggunakan list comprehension. Setelah itu, iterasikan daftar token dan buat stem dari setiap token. Ingat bahwa list comprehension adalah alternatif satu baris untuk perulangan for.
Latihan ini adalah bagian dari kursus
Analisis Sentimen dengan Python
Petunjuk latihan
- Impor fungsi yang kita gunakan untuk mengubah string menjadi stem.
- Panggil fungsi Porter stemmer yang baru saja Anda impor.
- Dengan list comprehension, buat daftar
tokens. Daftar ini harus berisi semua token kata dari arraytweets. - Iterasikan daftar
tokensdan terapkan fungsi stemming pada setiap item dalam daftar.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import the function to perform stemming
____
from nltk import word_tokenize
# Call the stemmer
porter = ____()
# Transform the array of tweets to tokens
tokens = [____]
# Stem the list of tokens
stemmed_tokens = [[____.____(word) for word in tweet] for tweet in tokens]
# Print the first element of the list
print(stemmed_tokens[0])