Prédire si des étudiant·e·s vont réussir
Dans l’exercice précédent, vous avez calculé les paramètres du modèle de régression logistique qui s’ajuste aux données d’heures d’étude et de résultats au test.
Avec ces paramètres, vous pouvez prédire la performance des étudiant·e·s en fonction de leurs heures d’étude. Utilisez model.predict() pour obtenir les résultats basés sur la régression logistique.
Pour vous simplifier la tâche, LogisticRegression a été importé depuis sklearn.linear_model et numpy a été importé sous le nom np.
Cet exercice fait partie du cours
Fondamentaux des probabilités en Python
Instructions
- Créez un tableau avec les valeurs 10, 11, 12, 13 et 14 pour prédire les résultats d’un test en fonction de ces nombres d’heures d’étude.
- Utilisez
model.predict()pour obtenir les résultats du modèle et affichez ces résultats. - Utilisez
model.predict_proba()pour obtenir la probabilité de réussir le test avec 11 heures d’étude.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Specify values to predict
hours_of_study_test = [[____], [____], [____], [____], [____]]
# Pass values to predict
predicted_outcomes = model.____(____)
print(predicted_outcomes)
# Set value in array
value = np.asarray(11).reshape(-1,1)
# Probability of passing the test with 11 hours of study
print("Probability of passing test ", model.____(value)[:,1])