ComenzarEmpieza gratis

Transformar texto en números con BoW

Ahora que has creado un vocabulario a partir de las reseñas de clientes, ya puedes transformar cada reseña a un formato numérico usando el modelo Bag-of-Words (BoW). Este paso genera una matriz estructurada donde cada fila representa una reseña y cada columna corresponde a una palabra del vocabulario.

La lista cleaned_reviews y el vectorizer ya ajustado están precargados para ti.

Este ejercicio forma parte del curso

Natural Language Processing (NLP) en Python

Ver curso

Instrucciones del ejercicio

  • Transforma cleaned_reviews en una bow_matrix.
  • Imprime la representación BoW como un array de NumPy.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Transform the reviews
bow_matrix = vectorizer.____(____)

# Print the BoW representation
print(____.____())
Editar y ejecutar código