CommencerCommencer gratuitement

Tout rassembler

L’un·e des ingénieur·e·s de votre startup de détection d’arythmies se précipite dans votre bureau pour vous signaler un problème avec le capteur ECG pour les personnes en surpoids. Vous décidez de réduire de 50 % l’influence des exemples dont le poids dépasse 80. On vous indique aussi que, comme votre startup vise le marché du fitness et ne fait aucune revendication médicale, affoler inutilement un·e athlète coûte plus cher que de manquer un cas potentiel d’arythmie. Vous décidez donc de créer une fonction de perte personnalisée qui rend chaque « fausse alerte » dix fois plus coûteuse qu’un cas d’arythmie manqué. Le sous‑pondérage des sujets en surpoids améliore‑t‑il cette perte personnalisée ? Vos données d’entraînement X_train, y_train et de test X_test, y_test sont préchargées, ainsi que confusion_matrix(), numpy sous np, et DecisionTreeClassifier().

Cet exercice fait partie du cours

Concevoir des workflows de Machine Learning en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a scorer assigning more cost to false positives
def my_scorer(y_test, y_est, cost_fp=10.0, cost_fn=1.0):
    tn, fp, fn, tp = ____
    return ____
Modifier et exécuter le code