IniziaInizia gratis

Confrontare le rappresentazioni BoW e TF‑IDF

Fai parte del team di analytics di un'azienda di wearable tech. Il tuo obiettivo è aiutare i product manager a capire il feedback dei clienti sul nuovo smartwatch dell'azienda. Hai già preprocessato il testo e creato due rappresentazioni: bow_matrix usando CountVectorizer() e tfidf_matrix usando TfidfVectorizer(). In questo esercizio visualizzerai e confronterai le due rappresentazioni per capire meglio come ciascuna cattura l'importanza delle parole.

Questo esercizio fa parte del corso

Natural Language Processing (NLP) in Python

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Convert BoW matrix to a DataFrame
df_bow = pd.DataFrame(
    ____,
    columns=vectorizer.____
)

# Plot the heatmap
plt.figure(figsize=(10, 6))
sns.heatmap(____, annot=True)
plt.title("BoW Scores Across Reviews")
plt.xlabel("Terms")
plt.xticks(rotation=45)
plt.ylabel("Documents")
plt.show()
Modifica ed esegui il codice