Confrontare le rappresentazioni BoW e TF‑IDF
Fai parte del team di analytics di un'azienda di wearable tech. Il tuo obiettivo è aiutare i product manager a capire il feedback dei clienti sul nuovo smartwatch dell'azienda. Hai già preprocessato il testo e creato due rappresentazioni: bow_matrix usando CountVectorizer() e tfidf_matrix usando TfidfVectorizer(). In questo esercizio visualizzerai e confronterai le due rappresentazioni per capire meglio come ciascuna cattura l'importanza delle parole.
Questo esercizio fa parte del corso
Natural Language Processing (NLP) in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Convert BoW matrix to a DataFrame
df_bow = pd.DataFrame(
____,
columns=vectorizer.____
)
# Plot the heatmap
plt.figure(figsize=(10, 6))
sns.heatmap(____, annot=True)
plt.title("BoW Scores Across Reviews")
plt.xlabel("Terms")
plt.xticks(rotation=45)
plt.ylabel("Documents")
plt.show()