ComeçarComece de graça

Transformando texto em números com BoW

Agora que você construiu um vocabulário a partir das avaliações de clientes, é hora de transformar cada avaliação em um formato numérico usando o modelo Bag-of-Words (BoW). Esta etapa cria uma matriz estruturada em que cada linha representa uma avaliação e cada coluna corresponde a uma palavra do vocabulário.

A lista cleaned_reviews e o vectorizer já ajustado estão pré-carregados para você.

Este exercício faz parte do curso

Processamento de Linguagem Natural (NLP) em Python

Ver curso

Instruções do exercício

  • Transforme cleaned_reviews em uma bow_matrix.
  • Imprima a representação BoW como um array NumPy.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Transform the reviews
bow_matrix = vectorizer.____(____)

# Print the BoW representation
print(____.____())
Editar e executar o código