LoslegenKostenlos loslegen

Stems aus Tweets

In dieser Übung arbeitest du mit einem Array namens tweets. Es enthält den Text der Airline-Sentiment-Daten, die von Twitter gesammelt wurden.

Deine Aufgabe ist es, dieses Array mithilfe von List Comprehensions in eine Liste von Tokens umzuwandeln. Danach iterierst du über die Token-Liste und erzeugst für jedes Token einen Stem. Denk daran, dass List Comprehensions eine einzeilige Alternative zu for-Schleifen sind.

Diese Übung ist Teil des Kurses

Stimmungsanalyse in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere die Funktion, mit der wir Strings in Stems umwandeln.
  • Rufe die gerade importierte Porter-Stemmer-Funktion auf.
  • Erstelle mit einer List Comprehension die Liste tokens. Sie soll alle Wort-Tokens aus dem Array tweets enthalten.
  • Iteriere über die Liste tokens und wende die Stemming-Funktion auf jedes Element der Liste an.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import the function to perform stemming
____
from nltk import word_tokenize

# Call the stemmer
porter = ____()

# Transform the array of tweets to tokens
tokens = [____]
# Stem the list of tokens
stemmed_tokens = [[____.____(word) for word in tweet] for tweet in tokens] 
# Print the first element of the list
print(stemmed_tokens[0])
Code bearbeiten und ausführen