BoW ve TF-IDF gösterimlerini karşılaştırma
Giyilebilir teknoloji üreten bir şirkette analitik ekibindesin. Amacın, ürün yöneticilerinin şirketin yeni akıllı saatiyle ilgili müşteri geri bildirimlerini anlamasına yardımcı olmak. Metni çoktan ön işledin ve iki farklı gösterim oluşturdun: CountVectorizer() ile bow_matrix ve TfidfVectorizer() ile tfidf_matrix. Bu egzersizde, her birinin kelime önemini nasıl yakaladığını daha iyi anlamak için bu iki gösterimi görselleştirip karşılaştıracaksın.
Bu egzersiz, kursun bir parçasıdır
Python ile Natural Language Processing (NLP)
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Convert BoW matrix to a DataFrame
df_bow = pd.DataFrame(
____,
columns=vectorizer.____
)
# Plot the heatmap
plt.figure(figsize=(10, 6))
sns.heatmap(____, annot=True)
plt.title("BoW Scores Across Reviews")
plt.xlabel("Terms")
plt.xticks(rotation=45)
plt.ylabel("Documents")
plt.show()