Meer string-operators en Twitter
In deze oefening pas je verschillende string-operators toe op drie strings, geselecteerd uit de gegevensset tweets. Een tweets_list is al voor je gemaakt.
Je maakt drie nieuwe lijsten door verschillende string-operators toe te passen:
- een lijst met alleen letters
- een lijst met alleen niet-alfanumerieke tekens
- een lijst met alleen cijfers
De benodigde functies zijn al voor je geïmporteerd uit nltk.
Deze oefening maakt deel uit van de cursus
Sentimentanalyse in Python
Oefeninstructies
- Maak een lijst met tokens uit
tweets_list. - Verwijder in de lijst
lettersalle cijfers en andere tekens; houd dus alleen letters over. - Behoud alfanumerieke tekens maar verwijder alle andere tekens in
let_digits. - Maak
digitsdoor letters en andere tekens te verwijderen en alleen nummers over te houden.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a list of lists, containing the tokens from list_tweets
tokens = [____(item) for item in tweets_list]
# Remove characters and digits , i.e. retain only letters
letters = [[word for word in item if ____.____] for item in tokens]
# Remove characters, i.e. retain only letters and digits
let_digits = [[word for word in item if ____.____] for item in tokens]
# Remove letters and characters, retain only digits
digits = [[word for word in item if ____.____] for item in tokens]
# Print the last item in each list
print('Last item in alphabetic list: ', letters[2])
print('Last item in list of alphanumerics: ', let_digits[2])
print('Last item in the list of digits: ', digits[2])