Especifica el patrón de tokens

En este ejercicio, trabajarás con la columna text del conjunto de datos tweets. Tu tarea es vectorizar la columna de tipo objeto usando CountVectorizer. Aplicarás distintos patrones de tokens en el vectorizador. Recuerda que al especificar el patrón de tokens puedes filtrar caracteres.

CountVectorizer ya se ha importado por ti.

Este ejercicio forma parte del curso

Sentiment Analysis in Python

Ver curso

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Build and fit the vectorizer
vect = ____(____=r'\b[^\d\W][^\d\W]+\b').fit(tweets.text)
vect.transform(tweets.text)
print('Length of vectorizer: ', len(vect.get_feature_names()))

Editar y ejecutar código