Mengonversi teks menjadi angka dengan BoW
Setelah Anda membangun kosakata dari ulasan pelanggan, kini Anda siap mengonversi setiap ulasan ke format numerik menggunakan model Bag-of-Words (BoW). Langkah ini membuat matriks terstruktur di mana setiap baris merepresentasikan sebuah ulasan dan setiap kolom merepresentasikan sebuah kata dari kosakata.
Daftar cleaned_reviews dan vectorizer yang sudah dipasangkan (fitted) telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Natural Language Processing (NLP) in Python
Petunjuk latihan
- Transformasikan
cleaned_reviewsmenjadibow_matrix. - Cetak representasi BoW sebagai array NumPy.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Transform the reviews
bow_matrix = vectorizer.____(____)
# Print the BoW representation
print(____.____())