Voorspellen of studenten slagen
In de vorige oefening heb je de parameters berekend van het logistic regression-model dat past bij de gegevens over studie-uren en toetsresultaten.
Met die parameters kun je de prestaties van studenten voorspellen op basis van hun studie-uren. Gebruik model.predict() om de uitkomsten op basis van logistic regression te krijgen.
Voor het gemak is LogisticRegression geïmporteerd uit sklearn.linear_model en is numpy geïmporteerd als np.
Deze oefening maakt deel uit van de cursus
Basis van kansrekening in Python
Oefeninstructies
- Maak een array met de waarden 10, 11, 12, 13 en 14 om de uitkomsten voor een toets te voorspellen op basis van dat aantal studie-uren.
- Gebruik
model.predict()om de uitkomsten van het model te krijgen en print de uitkomsten. - Gebruik
model.predict_proba()om de kans te krijgen dat je slaagt voor de toets met 11 uur studietijd.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Specify values to predict
hours_of_study_test = [[____], [____], [____], [____], [____]]
# Pass values to predict
predicted_outcomes = model.____(____)
print(predicted_outcomes)
# Set value in array
value = np.asarray(11).reshape(-1,1)
# Probability of passing the test with 11 hours of study
print("Probability of passing test ", model.____(value)[:,1])