MulaiMulai sekarang secara gratis

Mengonversi teks menjadi angka dengan BoW

Setelah Anda membangun kosakata dari ulasan pelanggan, kini Anda siap mengonversi setiap ulasan ke format numerik menggunakan model Bag-of-Words (BoW). Langkah ini membuat matriks terstruktur di mana setiap baris merepresentasikan sebuah ulasan dan setiap kolom merepresentasikan sebuah kata dari kosakata.

Daftar cleaned_reviews dan vectorizer yang sudah dipasangkan (fitted) telah dimuat untuk Anda.

Latihan ini adalah bagian dari kursus

Natural Language Processing (NLP) in Python

Lihat Kursus

Petunjuk latihan

  • Transformasikan cleaned_reviews menjadi bow_matrix.
  • Cetak representasi BoW sebagai array NumPy.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Transform the reviews
bow_matrix = vectorizer.____(____)

# Print the BoW representation
print(____.____())
Edit dan Jalankan Kode