Aan de slagGa gratis aan de slag

Univariate driftdetectie voor de hotelboekingen-gegevensset

In de vorige oefeningen hebben we met de multivariate driftdetectiemethode vastgesteld dat de verschuiving in de gegevens in januari verantwoordelijk is voor de alert in de ROC AUC-metriek en de negatieve businesswaarde van het model.

In deze oefening gebruik je een univariate driftdetectiemethode om de feature en de verklaring achter de drift te vinden.

De reference- en analysis-sets zijn al voor je ingeladen.

Deze oefening maakt deel uit van de cursus

Monitoring Machine Learning in Python

Cursus bekijken

Oefeninstructies

  • Specificeer de Wasserstein- en Jensen-Shannon-methode voor continue variabelen en L-infinity en Chi2 voor categorische variabelen.
  • Fit op de reference en bereken resultaten op de analysis-set.
  • Plot de resultaten.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Intialize the univariate drift calculator
uv_calc = nannyml.UnivariateDriftCalculator(
    column_names=feature_column_names,
    timestamp_column_name='timestamp',
    chunk_period='m',
    continuous_methods=[____, ____],
    categorical_methods=[____, ____],
)

# Plot the results
uv_calc.____(reference)
uv_results = uv_calc.____(analysis)
____.____().____()
Code bewerken en uitvoeren