MulaiMulai sekarang secara gratis

Membandingkan representasi BoW dan TF-IDF

Anda adalah bagian dari tim analitik di sebuah perusahaan perangkat wearable. Tujuan Anda adalah membantu manajer produk memahami umpan balik pelanggan atas smartwatch baru perusahaan. Anda telah melakukan prapemrosesan teks dan membuat dua representasi: bow_matrix menggunakan CountVectorizer(), dan tfidf_matrix menggunakan TfidfVectorizer(). Dalam latihan ini, Anda akan memvisualisasikan dan membandingkan keduanya untuk memahami lebih baik bagaimana masing-masing menangkap pentingnya kata.

Latihan ini adalah bagian dari kursus

Natural Language Processing (NLP) in Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Convert BoW matrix to a DataFrame
df_bow = pd.DataFrame(
    ____,
    columns=vectorizer.____
)

# Plot the heatmap
plt.figure(figsize=(10, 6))
sns.heatmap(____, annot=True)
plt.title("BoW Scores Across Reviews")
plt.xlabel("Terms")
plt.xticks(rotation=45)
plt.ylabel("Documents")
plt.show()
Edit dan Jalankan Kode