CommencerCommencer gratuitement

Détection de dérive univariée pour le jeu de données des réservations d’hôtel

Dans les exercices précédents, nous avons établi, à l’aide de la méthode de détection de dérive multivariée, que le changement de données en janvier est responsable de l’alerte sur la métrique ROC AUC et de la valeur métier négative du modèle.

Dans cet exercice, vous allez utiliser une méthode de détection de dérive univariée pour identifier la variable explicative ainsi que l’explication de la dérive.

Les ensembles reference et analysis sont déjà préchargés pour vous.

Cet exercice fait partie du cours

Surveiller le Machine Learning en Python

Afficher le cours

Instructions

  • Indiquez les méthodes Wasserstein et Jensen-Shannon pour les variables continues, et L-infinity et Chi2 pour les variables catégorielles.
  • Ajustez sur l’ensemble de référence, puis calculez les résultats sur l’ensemble d’analyse.
  • Tracez les résultats.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Intialize the univariate drift calculator
uv_calc = nannyml.UnivariateDriftCalculator(
    column_names=feature_column_names,
    timestamp_column_name='timestamp',
    chunk_period='m',
    continuous_methods=[____, ____],
    categorical_methods=[____, ____],
)

# Plot the results
uv_calc.____(reference)
uv_results = uv_calc.____(analysis)
____.____().____()
Modifier et exécuter le code