Especifica el patrón de tokens
En este ejercicio, trabajarás con la columna text del conjunto de datos tweets. Tu tarea es vectorizar la columna de tipo objeto usando CountVectorizer. Aplicarás distintos patrones de tokens en el vectorizador. Recuerda que al especificar el patrón de tokens puedes filtrar caracteres.
CountVectorizer ya se ha importado por ti.
Este ejercicio forma parte del curso
Sentiment Analysis in Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Build and fit the vectorizer
vect = ____(____=r'\b[^\d\W][^\d\W]+\b').fit(tweets.text)
vect.transform(tweets.text)
print('Length of vectorizer: ', len(vect.get_feature_names()))