MulaiMulai sekarang secara gratis

Stem dari tweet

Dalam latihan ini, Anda akan bekerja dengan array bernama tweets. Array ini berisi teks data sentimen maskapai yang dikumpulkan dari Twitter.

Tugas Anda adalah memproses array ini dan mengubahnya menjadi daftar token menggunakan list comprehension. Setelah itu, iterasikan daftar token dan buat stem dari setiap token. Ingat bahwa list comprehension adalah alternatif satu baris untuk perulangan for.

Latihan ini adalah bagian dari kursus

Analisis Sentimen dengan Python

Lihat Kursus

Petunjuk latihan

  • Impor fungsi yang kita gunakan untuk mengubah string menjadi stem.
  • Panggil fungsi Porter stemmer yang baru saja Anda impor.
  • Dengan list comprehension, buat daftar tokens. Daftar ini harus berisi semua token kata dari array tweets.
  • Iterasikan daftar tokens dan terapkan fungsi stemming pada setiap item dalam daftar.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import the function to perform stemming
____
from nltk import word_tokenize

# Call the stemmer
porter = ____()

# Transform the array of tweets to tokens
tokens = [____]
# Stem the list of tokens
stemmed_tokens = [[____.____(word) for word in tweet] for tweet in tokens] 
# Print the first element of the list
print(stemmed_tokens[0])
Edit dan Jalankan Kode