Aan de slagBegin gratis

Bedrijfsberekening voor hotelboekingsgegevensset

Eerder maakte je kennis met de uitdaging om annuleringen van boekingen te voorspellen. Hier werk je met de echte Hotel Booking-gegevensset, waarin een model annuleringen voorspelt op basis van het land van herkomst van de klant, de tijd tussen boeken en aankomst, het aantal benodigde parkeerplaatsen en het gekozen hotel.

De referentie- en analysemappen zijn al voor je ingeladen. Hier zijn de eerste twee rijen:

  country  lead_time  parking_spaces       hotel  y_pred  y_pred_proba  is_canceled  timestamp
0  FRA     120        0               City Hotel  0       0.239983      0           2016-05-01
1  ITA     120        1               City Hotel  0       0.003965      0           2016-05-01

Je taak is om de monetaire waarde en de ROC AUC-prestatie van het model te controleren.

Deze oefening maakt deel uit van de cursus

Monitoring Machine Learning in Python

Bekijk cursus

Oefeninstructies

  • Initialiseer een aangepaste drempel met 0 als onderwaarde en 150.000 als bovenwaarde.
  • Specificeer de business_value- en roc_auc-metriek voor monitoring.
  • Stel TN in op 0, FP op -100, FN op -200 en TP op 1500 in business_value_matrix.
  • Koppel de aangepaste drempel aan de business value-metriek.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Custom business value thresholds
ct = ConstantThreshold(____=____, ____=____)
# Intialize the performance calculator
calc = PerformanceCalculator(problem_type='classification_binary',
			y_pred_proba='y_pred_proba',
  			timestamp_column_name="timestamp", 		
  			y_pred='y_pred',
  			y_true='is_canceled',
            chunk_period='m',
  			metrics=[____, ____],
  			business_value_matrix = [[____, ____],[____, ____]],
  			thresholds={____: ____})
calc = calc.fit(reference)
calc_res = calc.calculate(analysis)
calc_res.filter(period='analysis').plot().show()
Code bewerken en uitvoeren