BoW ve TF-IDF gösterimlerini karşılaştırma
Giyilebilir teknoloji üreten bir şirkette analitik ekibindesin. Amacın, ürün yöneticilerinin şirketin yeni akıllı saatiyle ilgili müşteri geri bildirimlerini anlamasına yardımcı olmak. Metni çoktan ön işledin ve iki farklı gösterim oluşturdun: CountVectorizer() ile bow_matrix ve TfidfVectorizer() ile tfidf_matrix. Bu egzersizde, her birinin kelime önemini nasıl yakaladığını daha iyi anlamak için bu iki gösterimi görselleştirip karşılaştıracaksın.
Bu egzersiz
Python ile Natural Language Processing (NLP)
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Convert BoW matrix to a DataFrame
df_bow = pd.DataFrame(
____,
columns=vectorizer.____
)
# Plot the heatmap
plt.figure(figsize=(10, 6))
sns.heatmap(____, annot=True)
plt.title("BoW Scores Across Reviews")
plt.xlabel("Terms")
plt.xticks(rotation=45)
plt.ylabel("Documents")
plt.show()