Logistische Regression mit Twitter-Daten

In dieser Übung baust du ein logistisches Regressionsmodell mit dem Datensatz tweets. Das Ziel ist airline_sentiment, das bei negativen Tweets 0, bei neutralen 1 und bei positiven 2 ist. Du hast hier also eine Klassifikationsaufgabe mit mehreren Klassen. Alles, was wir über binäre Probleme gelernt haben, gilt auch für Mehrklassen-Klassifikationsprobleme.

Du bewertest die Genauigkeit des Modells mit den zwei verschiedenen Ansätzen aus den Folien.

Die Funktion für die logistische Regression und der Accuracy-Score wurden bereits für dich importiert.

Diese Übung ist Teil des Kurses

<Kurs>Stimmungsanalyse in Python</Kurs>

Kurs ansehen

Übungsanweisungen

Baue und fitte ein logistisches Regressionsmodell und verwende die definierten X und y als Argumente.
Berechne die Genauigkeit des logistischen Regressionsmodells.
Sage die Labels voraus.
Berechne den Accuracy Score mithilfe der vorhergesagten und der wahren Labels.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Define the vector of targets and matrix of features
y = tweets.airline_sentiment
X = tweets.drop('airline_sentiment', axis=1)

# Build a logistic regression model and calculate the accuracy
log_reg = ____.____(X, y)
print('Accuracy of logistic regression: ', log_reg.____)

# Create an array of prediction
y_predict = log_reg.____

# Print the accuracy using accuracy score
print('Accuracy of logistic regression: ', ____(___, ____))

Code bearbeiten und ausführen