Detecção de drift univariado no conjunto de dados de reservas de hotel
Nos exercícios anteriores, usamos o método de detecção de drift multivariado para concluir que a mudança nos dados em janeiro é responsável pelo alerta na métrica ROC AUC e pelo valor de negócio negativo do modelo.
Neste exercício, você vai usar um método de detecção de drift univariado para identificar a variável e a explicação por trás do drift.
Os conjuntos reference e analysis já estão pré-carregados para você.
Este exercício faz parte do curso
Monitoramento de Machine Learning em Python
Instruções do exercício
- Especifique os métodos Wasserstein e Jensen-Shannon para variáveis contínuas e L-infinity e Chi2 para categóricas.
- Faça o fit no conjunto de referência e calcule os resultados no conjunto de análise.
- Plote os resultados.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Intialize the univariate drift calculator
uv_calc = nannyml.UnivariateDriftCalculator(
column_names=feature_column_names,
timestamp_column_name='timestamp',
chunk_period='m',
continuous_methods=[____, ____],
categorical_methods=[____, ____],
)
# Plot the results
uv_calc.____(reference)
uv_results = uv_calc.____(analysis)
____.____().____()