Voorspel kansen van filmrecensies
In deze oefening bouw je een logistieke regressie met de movies-gegevensset. De labels staan in de array y en de features in X.
Train het model op de trainingsdata. In plaats van klassen te voorspellen, voorspel je de kansen dat elk voorbeeld in de testset tot een van de twee klassen behoort.
De functies voor logistieke regressie en train/test-splitsen zijn alvast voor je geïmporteerd.
Deze oefening maakt deel uit van de cursus
Sentimentanalyse in Python
Oefeninstructies
- Split de data in een trainings- en een testset.
- Train een logistiek regressiemodel.
- Voorspel de kansen voor klasse 0 en voor klasse 1 van de testdata. Klasse 0 staat in de eerste kolom van de voorspelde kansen, en klasse 1 in de tweede.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Split into training and testing
X_train, X_test, y_train, y_test = ____(___, ___, test_size=0.2, random_state=321)
# Train a logistic regression
log_reg = ____.____
# Predict the probability of the 0 class
prob_0 = log_reg.____[:, ____]
# Predict the probability of the 1 class
prob_1 = log_reg.____[:, ____]
print("First 10 predicted probabilities of class 0: ", prob_0[:10])
print("First 10 predicted probabilities of class 1: ", prob_1[:10])