Drift no conjunto de dados de reservas de hotel

No capítulo anterior, você calculou o valor de negócio e a métrica ROC AUC para um modelo que prevê cancelamentos de reserva. Você notou alguns alertas nos gráficos gerados, por isso é preciso investigar a presença de drift nos dados de análise.

Neste exercício, você vai inicializar o método de detecção de drift multivariado e comparar seus resultados com os resultados de performance calculados no capítulo anterior.

StandardDeviationThreshold já está importado, assim como os resultados de valor de negócio e ROC AUC armazenados na variável perf_results, e feature_column_names já está definido.

Este exercicio faz parte do curso

Monitoramento de Machine Learning em Python

Instruções do exercicio

Inicialize o método StandardDeviationThreshold e defina std_lower_multiplier como 2 e std_upper_multiplier como 1.
Adicione os seguintes nomes de features: country, lead_time, parking_spaces e hotel. Mantenha essa ordem.
Passe os thresholds previamente definidos e os nomes das features para o DataReconstructionDriftCalculator.
Mostre o gráfico de comparação com os resultados da detecção de drift multivariado (mv_results) e os resultados de performance (perf_results).

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Create standard deviation thresholds
stdt = StandardDeviationThreshold(____=____, ____=____)

# Define feature columns
feature_column_names = [____, ____, ____, ____]

# Intialize, fit, and show results of multivariate drift calculator
mv_calc = nannyml.DataReconstructionDriftCalculator(
    column_names=____,
	threshold = ____,
    timestamp_column_name='timestamp',
    chunk_period='m')
mv_calc.fit(reference)
mv_results = mv_calc.calculate(analysis)
mv_results.filter(period='analysis').____(____).plot().show()

Editar e Executar Código

Este exercicio faz parte do curso

Monitoramento de Machine Learning em Python

AvançadoNível de habilidade

4.8+

Comece o curso gratuitamente

Neste capítulo, você vai conhecer a biblioteca NannyML e suas funções fundamentais. Primeiro, você vai aprender o processo de preparar dados brutos para criar conjuntos de referência e de análise prontos para o monitoramento em produção. Como exemplo prático, você vai investigar a previsão do valor da gorjeta em corridas de táxi em Nova York. No fim do capítulo, você também vai descobrir como estimar o desempenho do modelo de previsão de gorjetas usando o NannyML.

Exercise 1: O que é o NannyML?Exercise 2: Principais recursos do NannyML Exercise 3: Carregar o conjunto de dados Exercise 4: Preparação de dados para o NannyML Exercise 5: Período de referência ou de análise?Exercise 6: Carregando e dividindo os dados Exercise 7: Criando conjuntos de referência e de análise Exercise 8: Estimativa de desempenho Exercise 9: Especifique o algoritmo e o tipo de problema Exercise 10: Interpretando resultados Exercise 11: Fluxo de trabalho CBPE e DLE Exercise 12: Estimativa de performance para a previsão de gorjetas

Neste capítulo, você será apresentado aos calculadores de desempenho realizado usados quando a verdade de terreno fica disponível. Você vai aprender métodos mais avançados para trabalhar com resultados, incluindo filtrar, plotar, converter para data frames, fazer chunking e definir limites personalizados. Por fim, você vai aplicar esse conhecimento para calcular o valor de negócio de um modelo treinado no conjunto de dados de reservas de hotel.

Exercise 1: Quando as labels estão disponíveis Exercise 2: Quando a estimativa de desempenho sai do esperado Exercise 3: Comparando a performance estimada e a realizada Exercise 4: Trabalhando com resultados calculados e estimados Exercise 5: Diferentes métodos de divisão em chunks Exercise 6: Modificando os limites (thresholds)Exercise 7: Interagindo com os resultados Exercise 8: Cálculo e estimativa de valor de negócio Exercise 9: Cálculo do valor de negócio Exercise 10: Queda no valor monetário Exercise 11: Cálculo de negócio para o conjunto de dados de reservas de hotel

Após detectar a degradação de desempenho no modelo de reservas de hotel, você vai aprender a identificar o problema subjacente que a causa. Neste capítulo, você conhecerá métodos de detecção de drift multivariado e univariado. Você também vai aprender a identificar problemas de qualidade dos dados e como tratar as causas que forem detectadas.

Exercise 1: Detecção de drift multivariado Exercise 2: Identificando deriva(s) relevante(s)Exercise 3: Drift no conjunto de dados de reservas de hotel

Exercicio Atual

Exercise 4: Detecção de drift univariado Exercise 5: Detecção de drift univariado no conjunto de dados de reservas de hotel Exercise 6: Classificando os resultados univariados Exercise 7: Visualizando variáveis com deriva Exercise 8: Verificações de qualidade de dados e estatísticas Exercise 9: Verificações de qualidade dos dados Exercise 10: Estatísticas resumidas Exercise 11: Resolução de problemas Exercise 12: Qual é a resolução?Exercise 13: Você deve não fazer nada ou fazer algo?Exercise 14: Implementando um fluxo de monitoramento Exercise 15: Parabéns