Uniéndolo todo
Una de las ingenieras de tu startup de detección de arritmias entra corriendo en tu despacho para avisarte de que hay un problema con el sensor de ECG para personas con sobrepeso. Decides reducir en un 50 % la influencia de los ejemplos con peso superior a 80. También te dicen que, como tu startup se dirige al mercado del fitness y no hace afirmaciones médicas, asustar innecesariamente a un atleta sale más caro que pasar por alto un posible caso de arritmia. Decides crear una función de pérdida personalizada que haga que cada «falsa alarma» cueste diez veces más que perder un caso de arritmia. ¿Reducir el peso de los sujetos con sobrepeso mejora esta pérdida personalizada? Tus datos de entrenamiento X_train, y_train y de prueba X_test, y_test ya están precargados, al igual que confusion_matrix(), numpy como np y DecisionTreeClassifier().
Este ejercicio forma parte del curso
Diseño de flujos de trabajo de Machine Learning en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a scorer assigning more cost to false positives
def my_scorer(y_test, y_est, cost_fp=10.0, cost_fn=1.0):
tn, fp, fn, tp = ____
return ____