Transformar texto en números con BoW
Ahora que has creado un vocabulario a partir de las reseñas de clientes, ya puedes transformar cada reseña a un formato numérico usando el modelo Bag-of-Words (BoW). Este paso genera una matriz estructurada donde cada fila representa una reseña y cada columna corresponde a una palabra del vocabulario.
La lista cleaned_reviews y el vectorizer ya ajustado están precargados para ti.
Este ejercicio forma parte del curso
Natural Language Processing (NLP) en Python
Instrucciones del ejercicio
- Transforma
cleaned_reviewsen unabow_matrix. - Imprime la representación BoW como un array de NumPy.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Transform the reviews
bow_matrix = vectorizer.____(____)
# Print the BoW representation
print(____.____())