Comparación entre las representaciones BoW y TF-IDF
Formas parte del equipo de análisis de una empresa de tecnología wearable. Tu objetivo es ayudar a los gestores de producto a comprender los comentarios de los clientes sobre el nuevo reloj inteligente de la empresa. Ya has preprocesado el texto y creado dos representaciones: « bow_matrix
» utilizando « CountVectorizer()
» y « tfidf_matrix
» utilizando « TfidfVectorizer()
». En este ejercicio, visualizarás y compararás ambos para comprender mejor cómo cada uno captura la importancia de las palabras.
Este ejercicio forma parte del curso
Procesamiento del lenguaje natural (NLP) en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Convert BoW matrix to a DataFrame
df_bow = pd.DataFrame(
____,
columns=vectorizer.____
)
# Plot the heatmap
plt.figure(figsize=(10, 6))
sns.heatmap(____, annot=True)
plt.title("BoW Scores Across Reviews")
plt.xlabel("Terms")
plt.xticks(rotation=45)
plt.ylabel("Documents")
plt.show()