Estimación del rendimiento para la predicción de propinas
En los ejercicios anteriores, preparaste un conjunto de referencia y otro de análisis para el conjunto de datos de NYC Green Taxi. En este, usarás esos datos para estimar el rendimiento del modelo en producción.
Primero, debes inicializar el algoritmo DLE con los parámetros proporcionados y luego representar los resultados.
El conjunto de referencia y el de análisis ya están cargados y guardados en las variables reference y analysis.
Además, nannyml ya está importado.
Este ejercicio forma parte del curso
Monitorización de Machine Learning en Python
Instrucciones del ejercicio
- Inicia el algoritmo DLE con un periodo de segmentación diario,
tip_amountcomoy_truey la métrica MSE. - Ajusta el conjunto
referenceal estimador DLE, estima el rendimiento para el conjunto de análisis y guarda la salida en la variableresults. - Visualiza los resultados usando los métodos
plot()yshow().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
estimator = nannyml.DLE(y_pred='y_pred',
timestamp_column_name='lpep_pickup_datetime',
feature_column_names=features,
chunk_period='d',
y_true='tip_amount',
metrics=['mse'])
# Fit the reference data to the DLE algorithm
estimator.____(____)
# Estimate the performance on the analysis data
results = estimator.____(____)
# Plot and show the results
____.____().____()