BaşlayınÜcretsiz başlayın

Otel rezervasyonu veri kümesinde kayma (drift)

Önceki bölümde, iptal edilecek rezervasyonları tahmin eden bir model için iş değeri ve ROC AUC performansını hesapladın. Ortaya çıkan grafiklerde birkaç uyarı fark ettin; bu yüzden analiz verilerinde drift olup olmadığını araştırman gerekiyor.

Bu egzersizde, çok değişkenli drift tespit yöntemini başlatacak ve sonuçlarını önceki bölümde hesaplanan performans sonuçlarıyla karşılaştıracaksın.

StandardDeviationThreshold zaten içe aktarılmış durumda; iş değeri ve ROC AUC sonuçları perf_results değişkeninde tutuluyor ve feature_column_names önceden tanımlandı.

Bu egzersiz, kursun bir parçasıdır

Python ile Machine Learning İzleme

Kursa Göz Atın

Egzersiz talimatları

  • StandardDeviationThreshold yöntemini başlat ve std_lower_multiplier değerini 2, std_upper_multiplier parametresini 1 olarak ayarla.
  • Şu özellik adlarını ekle: country, lead_time, parking_spaces ve hotel. Sıralarını koru.
  • Önceden tanımlanmış eşik değerlerini ve özellik adlarını DataReconstructionDriftCalculator içine geçir.
  • Hem çok değişkenli drift tespit sonuçlarını (mv_results) hem de performans sonuçlarını (perf_results) içeren karşılaştırma grafiğini göster.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Create standard deviation thresholds
stdt = StandardDeviationThreshold(____=____, ____=____)

# Define feature columns
feature_column_names = [____, ____, ____, ____]

# Intialize, fit, and show results of multivariate drift calculator
mv_calc = nannyml.DataReconstructionDriftCalculator(
    column_names=____,
	threshold = ____,
    timestamp_column_name='timestamp',
    chunk_period='m')
mv_calc.fit(reference)
mv_results = mv_calc.calculate(analysis)
mv_results.filter(period='analysis').____(____).plot().show()
Kodu Düzenle ve Çalıştır