Aan de slagGa gratis aan de slag

Prestatie-inschatting voor tipvoorspelling

In de vorige oefeningen heb je een reference- en analysis-set voorbereid voor de NYC Green Taxi-gegevensset. In deze oefening gebruik je die data om de modelprestaties in productie in te schatten.

Eerst initialiseer je het DLE-algoritme met de opgegeven parameters en maak je vervolgens een visualisatie van de resultaten.

De reference- en analysis-set zijn al geladen en opgeslagen in de variabelen reference en analysis. Daarnaast is nannyml ook al geïmporteerd.

Deze oefening maakt deel uit van de cursus

Monitoring Machine Learning in Python

Cursus bekijken

Oefeninstructies

  • Start het DLE-algoritme met een dagelijkse chunk-periode, tip_amount als y_true, en de MSE-metric.
  • Fit de reference-set op de DLE-estimator, schat de prestaties voor de analysis-set en sla de output op in de variabele results.
  • Visualiseer de resultaten met de methoden plot() en show().

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

estimator = nannyml.DLE(y_pred='y_pred',
    timestamp_column_name='lpep_pickup_datetime',
    feature_column_names=features,
    chunk_period='d',
    y_true='tip_amount',
    metrics=['mse'])

# Fit the reference data to the DLE algorithm
estimator.____(____)

# Estimate the performance on the analysis data
results = estimator.____(____)

# Plot and show the results
____.____().____()
Code bewerken en uitvoeren