Prestatie-inschatting voor tipvoorspelling
In de vorige oefeningen heb je een reference- en analysis-set voorbereid voor de NYC Green Taxi-gegevensset. In deze oefening gebruik je die data om de modelprestaties in productie in te schatten.
Eerst initialiseer je het DLE-algoritme met de opgegeven parameters en maak je vervolgens een visualisatie van de resultaten.
De reference- en analysis-set zijn al geladen en opgeslagen in de variabelen reference en analysis.
Daarnaast is nannyml ook al geïmporteerd.
Deze oefening maakt deel uit van de cursus
Monitoring Machine Learning in Python
Oefeninstructies
- Start het DLE-algoritme met een dagelijkse chunk-periode,
tip_amountalsy_true, en de MSE-metric. - Fit de
reference-set op de DLE-estimator, schat de prestaties voor de analysis-set en sla de output op in de variabeleresults. - Visualiseer de resultaten met de methoden
plot()enshow().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
estimator = nannyml.DLE(y_pred='y_pred',
timestamp_column_name='lpep_pickup_datetime',
feature_column_names=features,
chunk_period='d',
y_true='tip_amount',
metrics=['mse'])
# Fit the reference data to the DLE algorithm
estimator.____(____)
# Estimate the performance on the analysis data
results = estimator.____(____)
# Plot and show the results
____.____().____()