Membandingkan representasi BoW dan TF-IDF
Anda adalah bagian dari tim analitik di sebuah perusahaan perangkat wearable. Tujuan Anda adalah membantu manajer produk memahami umpan balik pelanggan atas smartwatch baru perusahaan. Anda telah melakukan prapemrosesan teks dan membuat dua representasi: bow_matrix menggunakan CountVectorizer(), dan tfidf_matrix menggunakan TfidfVectorizer(). Dalam latihan ini, Anda akan memvisualisasikan dan membandingkan keduanya untuk memahami lebih baik bagaimana masing-masing menangkap pentingnya kata.
Latihan ini adalah bagian dari kursus
Natural Language Processing (NLP) in Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Convert BoW matrix to a DataFrame
df_bow = pd.DataFrame(
____,
columns=vectorizer.____
)
# Plot the heatmap
plt.figure(figsize=(10, 6))
sns.heatmap(____, annot=True)
plt.title("BoW Scores Across Reviews")
plt.xlabel("Terms")
plt.xticks(rotation=45)
plt.ylabel("Documents")
plt.show()