CommencerCommencer gratuitement

Statistiques récapitulatives

Rappelez-vous, d’après la leçon précédente, que NannyML propose cinq méthodes pour suivre les variations statistiques de vos variables.

Dans cet exercice, vous allez vous concentrer sur la variable lead_time du jeu de données Hotel Booking, qui indique le nombre de jours entre la réservation et la date d’arrivée. En utilisant les statistiques de somme, de médiane et d’écart type, vous pourrez mieux comprendre comment le comportement de réservation des clients a évolué dans le temps.

Notez que les ensembles de référence et d’analyse, ainsi que la bibliothèque nannyml, sont déjà chargés et prêts à l’emploi.

Cet exercice fait partie du cours

Surveiller le Machine Learning en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Define analyzed column
analyzed_column = [____]

# Intialize sum values calculator
sum_calc = ____.____(
    ____=____, 
    chunk_period='m', 
    timestamp_column_name='timestamp'
)

# Fit, calculate and plot the results
sum_calc.fit(reference)
sum_calc_res = sum_calc.calculate(analysis)
sum_calc_res.plot().show()
Modifier et exécuter le code