Aan de slagGa gratis aan de slag

Bedrijfsberekening voor hotelboekingsgegevensset

Eerder maakte je kennis met de uitdaging om annuleringen van boekingen te voorspellen. Hier werk je met de echte Hotel Booking-gegevensset, waarin een model annuleringen voorspelt op basis van het land van herkomst van de klant, de tijd tussen boeken en aankomst, het aantal benodigde parkeerplaatsen en het gekozen hotel.

De referentie- en analysemappen zijn al voor je ingeladen. Hier zijn de eerste twee rijen:

  country  lead_time  parking_spaces       hotel  y_pred  y_pred_proba  is_canceled  timestamp
0  FRA     120        0               City Hotel  0       0.239983      0           2016-05-01
1  ITA     120        1               City Hotel  0       0.003965      0           2016-05-01

Je taak is om de monetaire waarde en de ROC AUC-prestatie van het model te controleren.

Deze oefening maakt deel uit van de cursus

Monitoring Machine Learning in Python

Cursus bekijken

Oefeninstructies

  • Initialiseer een aangepaste drempel met 0 als onderwaarde en 150.000 als bovenwaarde.
  • Specificeer de business_value- en roc_auc-metriek voor monitoring.
  • Stel TN in op 0, FP op -100, FN op -200 en TP op 1500 in business_value_matrix.
  • Koppel de aangepaste drempel aan de business value-metriek.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Custom business value thresholds
ct = ConstantThreshold(____=____, ____=____)
# Intialize the performance calculator
calc = PerformanceCalculator(problem_type='classification_binary',
			y_pred_proba='y_pred_proba',
  			timestamp_column_name="timestamp", 		
  			y_pred='y_pred',
  			y_true='is_canceled',
            chunk_period='m',
  			metrics=[____, ____],
  			business_value_matrix = [[____, ____],[____, ____]],
  			thresholds={____: ____})
calc = calc.fit(reference)
calc_res = calc.calculate(analysis)
calc_res.filter(period='analysis').plot().show()
Code bewerken en uitvoeren