Aan de slagGa gratis aan de slag

Meer string-operators en Twitter

In deze oefening pas je verschillende string-operators toe op drie strings, geselecteerd uit de gegevensset tweets. Een tweets_list is al voor je gemaakt.

Je maakt drie nieuwe lijsten door verschillende string-operators toe te passen:

  • een lijst met alleen letters
  • een lijst met alleen niet-alfanumerieke tekens
  • een lijst met alleen cijfers

De benodigde functies zijn al voor je geïmporteerd uit nltk.

Deze oefening maakt deel uit van de cursus

Sentimentanalyse in Python

Cursus bekijken

Oefeninstructies

  • Maak een lijst met tokens uit tweets_list.
  • Verwijder in de lijst letters alle cijfers en andere tekens; houd dus alleen letters over.
  • Behoud alfanumerieke tekens maar verwijder alle andere tekens in let_digits.
  • Maak digits door letters en andere tekens te verwijderen en alleen nummers over te houden.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create a list of lists, containing the tokens from list_tweets
tokens = [____(item) for item in tweets_list]

# Remove characters and digits , i.e. retain only letters
letters = [[word for word in item if ____.____] for item in tokens]
# Remove characters, i.e. retain only letters and digits
let_digits = [[word for word in item if ____.____] for item in tokens]
# Remove letters and characters, retain only digits
digits = [[word for word in item if ____.____] for item in tokens]

# Print the last item in each list
print('Last item in alphabetic list: ', letters[2])
print('Last item in list of alphanumerics: ', let_digits[2])
print('Last item in the list of digits: ', digits[2])
Code bewerken en uitvoeren