Calcul de la valeur métier pour le jeu de données des réservations d’hôtel
Vous avez déjà découvert le défi de prédire les annulations de réservation. Ici, vous allez travailler avec le jeu de données réel Hotel Booking, où un modèle prédit les annulations en fonction du pays d’origine du client, du délai entre la réservation et l’arrivée, des places de parking requises et de l’hôtel choisi.
Les jeux de référence et d’analyse ont déjà été chargés pour vous. Voici les deux premières lignes :
country lead_time parking_spaces hotel y_pred y_pred_proba is_canceled timestamp
0 FRA 120 0 City Hotel 0 0.239983 0 2016-05-01
1 ITA 120 1 City Hotel 0 0.003965 0 2016-05-01
Votre objectif est de vérifier la valeur monétaire du modèle et ses performances ROC AUC.
Cet exercice fait partie du cours
Surveiller le Machine Learning en Python
Instructions
- Initialisez un seuil personnalisé avec 0 comme valeur basse et 150 000 comme valeur haute.
- Indiquez les indicateurs
business_valueetroc_aucpour le monitoring. - Définissez
TNà 0,FPà -100,FNà -200 etTPà 1500 dansbusiness_value_matrix. - Associez le seuil personnalisé à l’indicateur de valeur métier.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Custom business value thresholds
ct = ConstantThreshold(____=____, ____=____)
# Intialize the performance calculator
calc = PerformanceCalculator(problem_type='classification_binary',
y_pred_proba='y_pred_proba',
timestamp_column_name="timestamp",
y_pred='y_pred',
y_true='is_canceled',
chunk_period='m',
metrics=[____, ____],
business_value_matrix = [[____, ____],[____, ____]],
thresholds={____: ____})
calc = calc.fit(reference)
calc_res = calc.calculate(analysis)
calc_res.filter(period='analysis').plot().show()