Comece agoraComece grátis

Transformando texto em números com BoW

Agora que você construiu um vocabulário a partir das avaliações de clientes, é hora de transformar cada avaliação em um formato numérico usando o modelo Bag-of-Words (BoW). Esta etapa cria uma matriz estruturada em que cada linha representa uma avaliação e cada coluna corresponde a uma palavra do vocabulário.

A lista cleaned_reviews e o vectorizer já ajustado estão pré-carregados para você.

Este exercicio faz parte do curso

Processamento de Linguagem Natural (NLP) em Python

Ver curso

Instruções do exercicio

  • Transforme cleaned_reviews em uma bow_matrix.
  • Imprima a representação BoW como um array NumPy.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Transform the reviews
bow_matrix = vectorizer.____(____)

# Print the BoW representation
print(____.____())
Editar e Executar Código