LoslegenKostenlos loslegen

Logistische Regression mit Twitter-Daten

In dieser Übung baust du ein logistisches Regressionsmodell mit dem Datensatz tweets. Das Ziel ist airline_sentiment, das bei negativen Tweets 0, bei neutralen 1 und bei positiven 2 ist. Du hast hier also eine Klassifikationsaufgabe mit mehreren Klassen. Alles, was wir über binäre Probleme gelernt haben, gilt auch für Mehrklassen-Klassifikationsprobleme.

Du bewertest die Genauigkeit des Modells mit den zwei verschiedenen Ansätzen aus den Folien.

Die Funktion für die logistische Regression und der Accuracy-Score wurden bereits für dich importiert.

Diese Übung ist Teil des Kurses

Stimmungsanalyse in Python

Kurs anzeigen

Anleitung zur Übung

  • Baue und fitte ein logistisches Regressionsmodell und verwende die definierten X und y als Argumente.
  • Berechne die Genauigkeit des logistischen Regressionsmodells.
  • Sage die Labels voraus.
  • Berechne den Accuracy Score mithilfe der vorhergesagten und der wahren Labels.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Define the vector of targets and matrix of features
y = tweets.airline_sentiment
X = tweets.drop('airline_sentiment', axis=1)

# Build a logistic regression model and calculate the accuracy
log_reg = ____.____(X, y)
print('Accuracy of logistic regression: ', log_reg.____)

# Create an array of prediction
y_predict = log_reg.____

# Print the accuracy using accuracy score
print('Accuracy of logistic regression: ', ____(___, ____))
Code bearbeiten und ausführen