Logistische Regression mit Twitter-Daten
In dieser Übung baust du ein logistisches Regressionsmodell mit dem Datensatz tweets. Das Ziel ist airline_sentiment, das bei negativen Tweets 0, bei neutralen 1 und bei positiven 2 ist. Du hast hier also eine Klassifikationsaufgabe mit mehreren Klassen. Alles, was wir über binäre Probleme gelernt haben, gilt auch für Mehrklassen-Klassifikationsprobleme.
Du bewertest die Genauigkeit des Modells mit den zwei verschiedenen Ansätzen aus den Folien.
Die Funktion für die logistische Regression und der Accuracy-Score wurden bereits für dich importiert.
Diese Übung ist Teil des Kurses
Stimmungsanalyse in Python
Anleitung zur Übung
- Baue und fitte ein logistisches Regressionsmodell und verwende die definierten
Xundyals Argumente. - Berechne die Genauigkeit des logistischen Regressionsmodells.
- Sage die Labels voraus.
- Berechne den Accuracy Score mithilfe der vorhergesagten und der wahren Labels.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Define the vector of targets and matrix of features
y = tweets.airline_sentiment
X = tweets.drop('airline_sentiment', axis=1)
# Build a logistic regression model and calculate the accuracy
log_reg = ____.____(X, y)
print('Accuracy of logistic regression: ', log_reg.____)
# Create an array of prediction
y_predict = log_reg.____
# Print the accuracy using accuracy score
print('Accuracy of logistic regression: ', ____(___, ____))