Estimation des performances pour la prédiction du pourboire
Dans les exercices précédents, vous avez préparé un jeu de référence et un jeu d’analyse pour le jeu de données NYC Green Taxi. Ici, vous allez utiliser ces données pour estimer les performances du modèle en production.
Commencez par initialiser l’algorithme DLE avec les paramètres fournis, puis tracez les résultats.
Le jeu de référence et le jeu d’analyse sont déjà chargés et enregistrés dans les variables reference et analysis.
De plus, nannyml est déjà importé.
Cet exercice fait partie du cours
Surveiller le Machine Learning en Python
Instructions
- Initialisez l’algorithme DLE avec une période de découpage quotidienne,
tip_amountcommey_true, et la métrique MSE. - Ajustez le jeu
referencesur l’estimateur DLE, estimez les performances pour le jeu d’analyse et enregistrez la sortie dans la variableresults. - Visualisez les résultats avec les méthodes
plot()etshow().
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
estimator = nannyml.DLE(y_pred='y_pred',
timestamp_column_name='lpep_pickup_datetime',
feature_column_names=features,
chunk_period='d',
y_true='tip_amount',
metrics=['mse'])
# Fit the reference data to the DLE algorithm
estimator.____(____)
# Estimate the performance on the analysis data
results = estimator.____(____)
# Plot and show the results
____.____().____()