ComenzarEmpieza gratis

Transformar texto en números con BoW

Ahora que ya has creado un vocabulario a partir de las opiniones de los clientes, estás listo para transformar cada opinión en un formato numérico utilizando el modelo Bag-of-Words (BoW). Este paso crea una matriz estructurada en la que cada fila representa una reseña y cada columna corresponde a una palabra del vocabulario.

La lista « cleaned_reviews » y la lista « vectorizer » ya están precargadas.

Este ejercicio forma parte del curso

Procesamiento del lenguaje natural (NLP) en Python

Ver curso

Instrucciones del ejercicio

  • Transforma el « cleaned_reviews » en un « bow_matrix ».
  • Imprime la representación BoW como un arreglo NumPy.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Transform the reviews
bow_matrix = vectorizer.____(____)

# Print the BoW representation
print(____.____())
Editar y ejecutar código