Más operadores de cadenas y Twitter
En este ejercicio aplicarás distintos operadores de cadenas a tres cadenas seleccionadas del conjunto de datos tweets. Ya tienes creada una tweets_list.
Necesitas construir tres listas nuevas aplicando diferentes operadores de cadenas:
- una lista que conserve solo letras
- una lista que conserve solo caracteres alfanuméricos
- una lista que conserve solo dígitos
Las funciones necesarias ya se han importado por ti desde nltk.
Este ejercicio forma parte del curso
Sentiment Analysis in Python
Instrucciones del ejercicio
- Crea una lista con los tokens de
tweets_list. - En la lista
letterselimina todos los dígitos y otros caracteres; es decir, conserva solo letras. - Conserva los caracteres alfanuméricos pero elimina los demás en
let_digits. - Crea
digitseliminando letras y otros caracteres y conservando solo números.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a list of lists, containing the tokens from list_tweets
tokens = [____(item) for item in tweets_list]
# Remove characters and digits , i.e. retain only letters
letters = [[word for word in item if ____.____] for item in tokens]
# Remove characters, i.e. retain only letters and digits
let_digits = [[word for word in item if ____.____] for item in tokens]
# Remove letters and characters, retain only digits
digits = [[word for word in item if ____.____] for item in tokens]
# Print the last item in each list
print('Last item in alphabetic list: ', letters[2])
print('Last item in list of alphanumerics: ', let_digits[2])
print('Last item in the list of digits: ', digits[2])