ComenzarEmpieza gratis

Más operadores de cadenas y Twitter

En este ejercicio aplicarás distintos operadores de cadenas a tres cadenas seleccionadas del conjunto de datos tweets. Ya tienes creada una tweets_list.

Necesitas construir tres listas nuevas aplicando diferentes operadores de cadenas:

  • una lista que conserve solo letras
  • una lista que conserve solo caracteres alfanuméricos
  • una lista que conserve solo dígitos

Las funciones necesarias ya se han importado por ti desde nltk.

Este ejercicio forma parte del curso

Sentiment Analysis in Python

Ver curso

Instrucciones del ejercicio

  • Crea una lista con los tokens de tweets_list.
  • En la lista letters elimina todos los dígitos y otros caracteres; es decir, conserva solo letras.
  • Conserva los caracteres alfanuméricos pero elimina los demás en let_digits.
  • Crea digits eliminando letras y otros caracteres y conservando solo números.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create a list of lists, containing the tokens from list_tweets
tokens = [____(item) for item in tweets_list]

# Remove characters and digits , i.e. retain only letters
letters = [[word for word in item if ____.____] for item in tokens]
# Remove characters, i.e. retain only letters and digits
let_digits = [[word for word in item if ____.____] for item in tokens]
# Remove letters and characters, retain only digits
digits = [[word for word in item if ____.____] for item in tokens]

# Print the last item in each list
print('Last item in alphabetic list: ', letters[2])
print('Last item in list of alphanumerics: ', let_digits[2])
print('Last item in the list of digits: ', digits[2])
Editar y ejecutar código