Estatísticas resumidas
Lembre-se da lição anterior: o NannyML oferece cinco métodos para acompanhar mudanças estatísticas nas suas variáveis.
Neste exercício, você vai analisar a variável lead_time do conjunto de dados de reservas de hotel, que indica quantos dias antes a reserva foi feita. Usando as estatísticas de soma, mediana e desvio padrão, você pode obter insights valiosos sobre como o comportamento de reserva dos clientes evoluiu ao longo do tempo.
Importante: tanto os conjuntos de referência e de análise quanto a biblioteca nannyml já estão pré-carregados e prontos para uso.
Este exercício faz parte do curso
Monitoramento de Machine Learning em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Define analyzed column
analyzed_column = [____]
# Intialize sum values calculator
sum_calc = ____.____(
____=____,
chunk_period='m',
timestamp_column_name='timestamp'
)
# Fit, calculate and plot the results
sum_calc.fit(reference)
sum_calc_res = sum_calc.calculate(analysis)
sum_calc_res.plot().show()