Bedrijfsberekening voor hotelboekingsgegevensset
Eerder maakte je kennis met de uitdaging om annuleringen van boekingen te voorspellen. Hier werk je met de echte Hotel Booking-gegevensset, waarin een model annuleringen voorspelt op basis van het land van herkomst van de klant, de tijd tussen boeken en aankomst, het aantal benodigde parkeerplaatsen en het gekozen hotel.
De referentie- en analysemappen zijn al voor je ingeladen. Hier zijn de eerste twee rijen:
country lead_time parking_spaces hotel y_pred y_pred_proba is_canceled timestamp
0 FRA 120 0 City Hotel 0 0.239983 0 2016-05-01
1 ITA 120 1 City Hotel 0 0.003965 0 2016-05-01
Je taak is om de monetaire waarde en de ROC AUC-prestatie van het model te controleren.
Deze oefening maakt deel uit van de cursus
Monitoring Machine Learning in Python
Oefeninstructies
- Initialiseer een aangepaste drempel met 0 als onderwaarde en 150.000 als bovenwaarde.
- Specificeer de
business_value- enroc_auc-metriek voor monitoring. - Stel
TNin op 0,FPop -100,FNop -200 enTPop 1500 inbusiness_value_matrix. - Koppel de aangepaste drempel aan de business value-metriek.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Custom business value thresholds
ct = ConstantThreshold(____=____, ____=____)
# Intialize the performance calculator
calc = PerformanceCalculator(problem_type='classification_binary',
y_pred_proba='y_pred_proba',
timestamp_column_name="timestamp",
y_pred='y_pred',
y_true='is_canceled',
chunk_period='m',
metrics=[____, ____],
business_value_matrix = [[____, ____],[____, ____]],
thresholds={____: ____})
calc = calc.fit(reference)
calc_res = calc.calculate(analysis)
calc_res.filter(period='analysis').plot().show()