Transformando texto em números com BoW
Agora que você construiu um vocabulário a partir das avaliações de clientes, é hora de transformar cada avaliação em um formato numérico usando o modelo Bag-of-Words (BoW). Esta etapa cria uma matriz estruturada em que cada linha representa uma avaliação e cada coluna corresponde a uma palavra do vocabulário.
A lista cleaned_reviews e o vectorizer já ajustado estão pré-carregados para você.
Este exercício faz parte do curso
Processamento de Linguagem Natural (NLP) em Python
Instruções do exercício
- Transforme
cleaned_reviewsem umabow_matrix. - Imprima a representação BoW como um array NumPy.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Transform the reviews
bow_matrix = vectorizer.____(____)
# Print the BoW representation
print(____.____())