Mehr String-Operatoren und Twitter
In dieser Übung wendest du verschiedene String-Operatoren auf drei Strings an, die aus dem tweets-Datensatz ausgewählt wurden. Eine tweets_list wurde für dich erstellt.
Du sollst drei neue Listen konstruieren, indem du unterschiedliche String-Operatoren anwendest:
- eine Liste, die nur Buchstaben enthält
- eine Liste, die nur alphanumerische Zeichen enthält
- eine Liste, die nur Ziffern enthält
Die benötigten Funktionen wurden für dich aus nltk importiert.
Diese Übung ist Teil des Kurses
Stimmungsanalyse in Python
Anleitung zur Übung
- Erstelle eine Liste der Tokens aus
tweets_list. - Entferne in der Liste
lettersalle Ziffern und sonstigen Zeichen, d. h. behalte nur Buchstaben. - Behalte in
let_digitsalphanumerische Zeichen bei, entferne aber alle anderen Zeichen. - Erstelle
digits, indem du Buchstaben und andere Zeichen entfernst und nur Zahlen übrig lässt.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a list of lists, containing the tokens from list_tweets
tokens = [____(item) for item in tweets_list]
# Remove characters and digits , i.e. retain only letters
letters = [[word for word in item if ____.____] for item in tokens]
# Remove characters, i.e. retain only letters and digits
let_digits = [[word for word in item if ____.____] for item in tokens]
# Remove letters and characters, retain only digits
digits = [[word for word in item if ____.____] for item in tokens]
# Print the last item in each list
print('Last item in alphabetic list: ', letters[2])
print('Last item in list of alphanumerics: ', let_digits[2])
print('Last item in the list of digits: ', digits[2])