Cálculo del valor de negocio para el conjunto de datos de reservas de hotel
Antes viste el reto de predecir cancelaciones de reservas. Aquí trabajarás con el conjunto de datos real de Hotel Booking, donde un modelo predice cancelaciones basándose en el país de origen del cliente, el tiempo entre la reserva y la llegada, las plazas de aparcamiento requeridas y el hotel elegido.
Ya tienes cargados los conjuntos de referencia y de análisis. Estas son las dos primeras filas:
country lead_time parking_spaces hotel y_pred y_pred_proba is_canceled timestamp
0 FRA 120 0 City Hotel 0 0.239983 0 2016-05-01
1 ITA 120 1 City Hotel 0 0.003965 0 2016-05-01
Tu tarea es comprobar el valor monetario del modelo y su rendimiento ROC AUC.
Este ejercicio forma parte del curso
Monitorización de Machine Learning en Python
Instrucciones del ejercicio
- Inicializa un umbral personalizado con 0 como valor inferior y 150000 como valor superior.
- Especifica las métricas
business_valueyroc_aucpara el monitoreo. - Define
TNcomo 0,FPcomo -100,FNcomo -200 yTPcomo 1500 enbusiness_value_matrix. - Asigna el umbral personalizado a la métrica de valor de negocio.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Custom business value thresholds
ct = ConstantThreshold(____=____, ____=____)
# Intialize the performance calculator
calc = PerformanceCalculator(problem_type='classification_binary',
y_pred_proba='y_pred_proba',
timestamp_column_name="timestamp",
y_pred='y_pred',
y_true='is_canceled',
chunk_period='m',
metrics=[____, ____],
business_value_matrix = [[____, ____],[____, ____]],
thresholds={____: ____})
calc = calc.fit(reference)
calc_res = calc.calculate(analysis)
calc_res.filter(period='analysis').plot().show()