Calculer la matrice de confusion
Comme vous l’avez vu dans la vidéo, le modèle de régression logistique génère deux types de prédictions : une prédiction continue sous forme de probabilité, et une prédiction de classe qui, dans l’exemple du jeu de données des puits (wells), est une catégorie discrète à deux classes.
Dans l’exercice précédent, vous avez calculé la prédiction continue sous forme de probabilité. Dans cet exercice, vous allez utiliser ces valeurs pour affecter une classe à chaque observation de votre échantillon wells_test. Enfin, vous décrirez le modèle à l’aide de la matrice de confusion.
Les prédictions calculées prediction et wells_test sont chargés dans votre espace de travail.
Cet exercice fait partie du cours
<cours>Modèles linéaires généralisés en Python</cours>Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Define the cutoff
cutoff = ____
# Compute class predictions: y_prediction
y_prediction = np.where(____ > ____, 1, 0)