ComenzarEmpieza gratis

Operadores de cadenas con los datos de Twitter

Sigues trabajando con los datos de tweets donde la columna text almacena el contenido de cada tweet.

Tu tarea es convertir la columna text en una lista de tokens. Luego, usando operadores de cadenas, elimina todos los caracteres no alfabéticos de la lista de tokens creada.

Este ejercicio forma parte del curso

Sentiment Analysis in Python

Ver curso

Instrucciones del ejercicio

  • Importa la función de tokenización de palabras.
  • Crea tokens de palabras a partir de cada tweet.
  • Filtra todos los caracteres no alfabéticos de la lista creada; es decir, conserva solo letras.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import the word tokenizing package
____

# Tokenize the text column
word_tokens = [____(review) for review in tweets.text]
print('Original tokens: ', word_tokens[0])

# Filter out non-letter characters
cleaned_tokens = [[word for word in item if ____.____] for item in word_tokens]
print('Cleaned tokens: ', cleaned_tokens[0])
Editar y ejecutar código