Voorspel kansen van filmrecensies

In deze oefening bouw je een logistieke regressie met de movies-gegevensset. De labels staan in de array y en de features in X.

Train het model op de trainingsdata. In plaats van klassen te voorspellen, voorspel je de kansen dat elk voorbeeld in de testset tot een van de twee klassen behoort.

De functies voor logistieke regressie en train/test-splitsen zijn alvast voor je geïmporteerd.

Deze oefening maakt deel uit van de cursus

Sentimentanalyse in Python

Bekijk cursus

Oefeninstructies

Split de data in een trainings- en een testset.
Train een logistiek regressiemodel.
Voorspel de kansen voor klasse 0 en voor klasse 1 van de testdata. Klasse 0 staat in de eerste kolom van de voorspelde kansen, en klasse 1 in de tweede.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Split into training and testing
X_train, X_test, y_train, y_test = ____(___, ___, test_size=0.2, random_state=321)

# Train a logistic regression
log_reg = ____.____

# Predict the probability of the 0 class
prob_0 = log_reg.____[:, ____]
# Predict the probability of the 1 class
prob_1 = log_reg.____[:, ____]

print("First 10 predicted probabilities of class 0: ", prob_0[:10])
print("First 10 predicted probabilities of class 1: ", prob_1[:10])

Code bewerken en uitvoeren