Transformar texto en números con BoW
Ahora que ya has creado un vocabulario a partir de las opiniones de los clientes, estás listo para transformar cada opinión en un formato numérico utilizando el modelo Bag-of-Words (BoW). Este paso crea una matriz estructurada en la que cada fila representa una reseña y cada columna corresponde a una palabra del vocabulario.
La lista « cleaned_reviews
» y la lista « vectorizer
» ya están precargadas.
Este ejercicio forma parte del curso
Procesamiento del lenguaje natural (NLP) en Python
Instrucciones del ejercicio
- Transforma el «
cleaned_reviews
» en un «bow_matrix
». - Imprime la representación BoW como un arreglo NumPy.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Transform the reviews
bow_matrix = vectorizer.____(____)
# Print the BoW representation
print(____.____())