Univariate driftdetectie voor de hotelboekingen-gegevensset
In de vorige oefeningen hebben we met de multivariate driftdetectiemethode vastgesteld dat de verschuiving in de gegevens in januari verantwoordelijk is voor de alert in de ROC AUC-metriek en de negatieve businesswaarde van het model.
In deze oefening gebruik je een univariate driftdetectiemethode om de feature en de verklaring achter de drift te vinden.
De reference- en analysis-sets zijn al voor je ingeladen.
Deze oefening maakt deel uit van de cursus
Monitoring Machine Learning in Python
Oefeninstructies
- Specificeer de Wasserstein- en Jensen-Shannon-methode voor continue variabelen en L-infinity en Chi2 voor categorische variabelen.
- Fit op de reference en bereken resultaten op de analysis-set.
- Plot de resultaten.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Intialize the univariate drift calculator
uv_calc = nannyml.UnivariateDriftCalculator(
column_names=feature_column_names,
timestamp_column_name='timestamp',
chunk_period='m',
continuous_methods=[____, ____],
categorical_methods=[____, ____],
)
# Plot the results
uv_calc.____(reference)
uv_results = uv_calc.____(analysis)
____.____().____()