Statistiques récapitulatives
Rappelez-vous, d’après la leçon précédente, que NannyML propose cinq méthodes pour suivre les variations statistiques de vos variables.
Dans cet exercice, vous allez vous concentrer sur la variable lead_time du jeu de données Hotel Booking, qui indique le nombre de jours entre la réservation et la date d’arrivée. En utilisant les statistiques de somme, de médiane et d’écart type, vous pourrez mieux comprendre comment le comportement de réservation des clients a évolué dans le temps.
Notez que les ensembles de référence et d’analyse, ainsi que la bibliothèque nannyml, sont déjà chargés et prêts à l’emploi.
Cet exercice fait partie du cours
<cours>Surveiller le Machine Learning en Python</cours>Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Define analyzed column
analyzed_column = [____]
# Intialize sum values calculator
sum_calc = ____.____(
____=____,
chunk_period='m',
timestamp_column_name='timestamp'
)
# Fit, calculate and plot the results
sum_calc.fit(reference)
sum_calc_res = sum_calc.calculate(analysis)
sum_calc_res.plot().show()