Précision et rappel
La précision et le rappel sont liés aux quatre issues présentées dans la leçon précédente et constituent des métriques d’évaluation essentielles pour tout modèle de Machine Learning. Idéalement, un modèle de CTR publicitaire doit avoir une précision élevée (fort ROI sur les dépenses publicitaires) et un rappel élevé (ciblage d’audience pertinent). Bien qu’il soit possible de calculer la précision et le rappel à la main, sklearn propose des implémentations pratiques que vous pouvez intégrer facilement dans votre flux de travail. Dans cet exercice, vous allez configurer un arbre de décision, puis calculer la précision et le rappel.
Le module pandas est disponible sous pd dans votre espace de travail et le DataFrame d’exemple est chargé sous df. Les variables explicatives sont dans X et la cible dans y. De plus, precision_score() et recall_score() de sklearn.metrics sont disponibles.
Cet exercice fait partie du cours
Prédire le CTR avec le Machine Learning en Python
Instructions
- Créez des jeux d’entraînement et de test pour
Xety. - Définissez un classifieur en arbre de décision et produisez des prédictions
y_preden ajustant le modèle. - Utilisez les fonctions de
sklearnpour obtenir les scores de précision et de rappel.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Set up training and testing split
X_train, X_test, y_train, y_test = ____(
____, ____, test_size = .2, random_state = 0)
# Create classifier and make predictions
clf = ____
y_pred = clf.____(____, _____).____(X_test)
# Evaluate precision and recall
prec = ____(y_test, ____, average = 'weighted')
recall = ____(y_test, ____, average = 'weighted')
print("Precision: %s, Recall: %s" %(prec, recall))