ComeçarComece de graça

Construindo vocabulário a partir das avaliações dos clientes

Você faz parte de uma equipe de análise de produtos na TechZone, uma empresa de eletrônicos de consumo. Você recebeu um pequeno lote de avaliações de clientes sobre um novo gadget. Para analisar as avaliações, primeiro você vai preparar o texto e criar um vocabulário, que é uma lista de palavras únicas que definem as características usadas para representar cada avaliação como dados numéricos.

A função “ preprocess() ” já vem pré-carregada pra você. Ele coloca o texto em minúsculas, divide em tokens e tira a pontuação.

Este exercício faz parte do curso

Processamento de Linguagem Natural (NLP) em Python

Ver curso

Instruções do exercício

  • Pré-processe cada avaliação no conjunto de dados usando a função “ preprocess() ”.
  • Ajuste o modelo de classificação de sentimentos ( vectorizer ) nas avaliações pré-processadas.
  • Imprima o vocabulário que você conseguiu.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

reviews = [
    "The product is fantastic! It works like a charm.",
    "I hated the product. It broke after one use.",
    "Product was okay, not the best, but fine overall."
]
# Preprocess the reviews
cleaned_reviews = [____ for ____ in ____]

vectorizer = CountVectorizer()
# Fit the vectorizer
vectorizer.____
# Print the vocabulary 
print(vectorizer.____)
Editar e executar o código