Comparando las representaciones BoW y TF-IDF
Formas parte del equipo de analítica de una empresa de tecnología wearable. Tu objetivo es ayudar a los product managers a entender los comentarios de los clientes sobre el nuevo smartwatch de la compañía. Ya has preprocesado el texto y creado dos representaciones: bow_matrix usando CountVectorizer(), y tfidf_matrix usando TfidfVectorizer(). En este ejercicio, vas a visualizar y comparar ambas para entender mejor cómo cada una capta la importancia de las palabras.
Este ejercicio forma parte del curso
Natural Language Processing (NLP) en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Convert BoW matrix to a DataFrame
df_bow = pd.DataFrame(
____,
columns=vectorizer.____
)
# Plot the heatmap
plt.figure(figsize=(10, 6))
sns.heatmap(____, annot=True)
plt.title("BoW Scores Across Reviews")
plt.xlabel("Terms")
plt.xticks(rotation=45)
plt.ylabel("Documents")
plt.show()