Wahrscheinlichkeiten für Filmrezensionen vorhersagen
In dieser Aufgabe baust du eine logistische Regression mit dem Datensatz movies. Die Labels liegen im Array y und die Merkmale in X.
Trainiere das Modell auf den Trainingsdaten. Anstatt Klassen vorherzusagen, sag die Wahrscheinlichkeiten voraus, mit der jede Instanz im Testset zu jeder der beiden Klassen gehört.
Die Funktionen für logistische Regression und den Train/Test-Split wurden bereits für dich importiert.
Diese Übung ist Teil des Kurses
Stimmungsanalyse in Python
Anleitung zur Übung
- Teile die Daten in Trainings- und Testmenge auf.
- Trainiere ein Modell der logistischen Regression.
- Sage die Wahrscheinlichkeiten für Klasse 0 und Klasse 1 der Testdaten voraus. Klasse 0 steht in der ersten Spalte der vorhergesagten Wahrscheinlichkeiten, Klasse 1 in der zweiten.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Split into training and testing
X_train, X_test, y_train, y_test = ____(___, ___, test_size=0.2, random_state=321)
# Train a logistic regression
log_reg = ____.____
# Predict the probability of the 0 class
prob_0 = log_reg.____[:, ____]
# Predict the probability of the 1 class
prob_1 = log_reg.____[:, ____]
print("First 10 predicted probabilities of class 0: ", prob_0[:10])
print("First 10 predicted probabilities of class 1: ", prob_1[:10])