Stems aus Tweets
In dieser Übung arbeitest du mit einem Array namens tweets. Es enthält den Text der Airline-Sentiment-Daten, die von Twitter gesammelt wurden.
Deine Aufgabe ist es, dieses Array mithilfe von List Comprehensions in eine Liste von Tokens umzuwandeln. Danach iterierst du über die Token-Liste und erzeugst für jedes Token einen Stem. Denk daran, dass List Comprehensions eine einzeilige Alternative zu for-Schleifen sind.
Diese Übung ist Teil des Kurses
Stimmungsanalyse in Python
Anleitung zur Übung
- Importiere die Funktion, mit der wir Strings in Stems umwandeln.
- Rufe die gerade importierte Porter-Stemmer-Funktion auf.
- Erstelle mit einer List Comprehension die Liste
tokens. Sie soll alle Wort-Tokens aus dem Arraytweetsenthalten. - Iteriere über die Liste
tokensund wende die Stemming-Funktion auf jedes Element der Liste an.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import the function to perform stemming
____
from nltk import word_tokenize
# Call the stemmer
porter = ____()
# Transform the array of tweets to tokens
tokens = [____]
# Stem the list of tokens
stemmed_tokens = [[____.____(word) for word in tweet] for tweet in tokens]
# Print the first element of the list
print(stemmed_tokens[0])