Stems aus Tweets

In dieser Übung arbeitest du mit einem Array namens tweets. Es enthält den Text der Airline-Sentiment-Daten, die von Twitter gesammelt wurden.

Deine Aufgabe ist es, dieses Array mithilfe von List Comprehensions in eine Liste von Tokens umzuwandeln. Danach iterierst du über die Token-Liste und erzeugst für jedes Token einen Stem. Denk daran, dass List Comprehensions eine einzeilige Alternative zu for-Schleifen sind.

Diese Übung ist Teil des Kurses

<Kurs>Stimmungsanalyse in Python</Kurs>

Kurs ansehen

Übungsanweisungen

Importiere die Funktion, mit der wir Strings in Stems umwandeln.
Rufe die gerade importierte Porter-Stemmer-Funktion auf.
Erstelle mit einer List Comprehension die Liste tokens. Sie soll alle Wort-Tokens aus dem Array tweets enthalten.
Iteriere über die Liste tokens und wende die Stemming-Funktion auf jedes Element der Liste an.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import the function to perform stemming
____
from nltk import word_tokenize

# Call the stemmer
porter = ____()

# Transform the array of tweets to tokens
tokens = [____]
# Stem the list of tokens
stemmed_tokens = [[____.____(word) for word in tweet] for tweet in tokens] 
# Print the first element of the list
print(stemmed_tokens[0])

Code bearbeiten und ausführen