Logistische Regression von Filmkritiken

Im Video haben wir gelernt, dass die logistische Regression ein gängiger Ansatz ist, um Klassifikationsaufgaben zu modellieren, zum Beispiel um das Sentiment als positiv oder negativ zu klassifizieren.

In dieser Übung arbeitest du mit dem Datensatz movies mit Rezensionen. Die Spalte label enthält das Sentiment: 1 für eine positive und 0 für eine negative Rezension. Die Textrezension wurde mithilfe von BOW in numerische Spalten umgewandelt.

Deine Aufgabe ist es, ein logistisches Regressionsmodell mit dem Datensatz movies zu erstellen und seine Genauigkeit zu berechnen.

Diese Übung ist Teil des Kurses

Stimmungsanalyse in Python

Kurs anzeigen

Anleitung zur Übung

Importiere die Funktion für die logistische Regression.
Erstelle eine logistische Regression und fitte sie mit den Labels y und den Features X.
Berechne die Genauigkeit des logistischen Regressionsmodells mit der Standardmethode .score().

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import the logistic regression
from ____.____ import ____

# Define the vector of targets and matrix of features
y = movies.label
X = movies.drop('label', axis=1)

# Build a logistic regression model and calculate the accuracy
log_reg = ____.____(X, y)
print('Accuracy of logistic regression: ', log_reg.____(X, y))

Code bearbeiten und ausführen