Otel rezervasyonu veri kümesinde kayma (drift)

Önceki bölümde, iptal edilecek rezervasyonları tahmin eden bir model için iş değeri ve ROC AUC performansını hesapladın. Ortaya çıkan grafiklerde birkaç uyarı fark ettin; bu yüzden analiz verilerinde drift olup olmadığını araştırman gerekiyor.

Bu egzersizde, çok değişkenli drift tespit yöntemini başlatacak ve sonuçlarını önceki bölümde hesaplanan performans sonuçlarıyla karşılaştıracaksın.

StandardDeviationThreshold zaten içe aktarılmış durumda; iş değeri ve ROC AUC sonuçları perf_results değişkeninde tutuluyor ve feature_column_names önceden tanımlandı.

Bu egzersiz, kursun bir parçasıdır

Python ile Machine Learning İzleme

Kursa Göz Atın

Egzersiz talimatları

StandardDeviationThreshold yöntemini başlat ve std_lower_multiplier değerini 2, std_upper_multiplier parametresini 1 olarak ayarla.
Şu özellik adlarını ekle: country, lead_time, parking_spaces ve hotel. Sıralarını koru.
Önceden tanımlanmış eşik değerlerini ve özellik adlarını DataReconstructionDriftCalculator içine geçir.
Hem çok değişkenli drift tespit sonuçlarını (mv_results) hem de performans sonuçlarını (perf_results) içeren karşılaştırma grafiğini göster.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Create standard deviation thresholds
stdt = StandardDeviationThreshold(____=____, ____=____)

# Define feature columns
feature_column_names = [____, ____, ____, ____]

# Intialize, fit, and show results of multivariate drift calculator
mv_calc = nannyml.DataReconstructionDriftCalculator(
    column_names=____,
	threshold = ____,
    timestamp_column_name='timestamp',
    chunk_period='m')
mv_calc.fit(reference)
mv_results = mv_calc.calculate(analysis)
mv_results.filter(period='analysis').____(____).plot().show()

Kodu Düzenle ve Çalıştır

Bu egzersiz, kursun bir parçasıdır

Python ile Machine Learning İzleme

AvançadoNível de habilidade

4.8+

Kursa Ücretsiz Başla

Bu bölümde NannyML kütüphanesi ve temel işlevleriyle tanışacaksın. Önce, ham veriyi üretim izlemeye hazır başvuru ve analiz setlerine dönüştürme sürecini öğreneceksin. Uygulamalı bir örnek olarak, New York’taki taksi yolculuklarında bahşiş tutarını tahmin etmeyi inceleyeceksin. Bölümün sonunda, NannyML kullanarak bahşiş tahmin modeli performansını nasıl tahmin edeceğini de keşfedeceksin.

Exercise 1: NannyML nedir?Exercise 2: NannyML'in temel özellikleri Exercise 3: Veri kümesini yükle Exercise 4: NannyML için veri hazırlama Exercise 5: Referans mı analiz dönemi mi?Exercise 6: Veriyi yükleme ve bölme Exercise 7: Referans ve analiz kümesi oluşturma Exercise 8: Performans tahmini Exercise 9: Algoritmayı ve problem türünü belirt Exercise 10: Sonuçları yorumlama Exercise 11: CBPE ve DLE iş akışı Exercise 12: Bahşiş tahmini için performans kestirimi

Bu bölümde, gerçek etiketler elde edildiğinde kullanılan gerçekleşen performans hesaplayıcılarıyla tanışacaksın. Sonuçları ele almak için filtreleme, görselleştirme, veri çerçevelerine dönüştürme, parçalara ayırma (chunking) ve özel eşikler belirleme gibi daha ileri yöntemleri öğreneceksin. Son olarak, bu bilgiyi otel rezervasyonu veri kümesi üzerinde eğitilmiş bir modelin iş değerini hesaplamak için uygulayacaksın.

Exercise 1: Etiketler mevcut olduğunda Exercise 2: Performans tahmini şaştığında Exercise 3: Tahmini ve gerçekleşen performansı karşılaştırma Exercise 4: Hesaplanmış ve tahmini sonuçlarla çalışmak Exercise 5: Farklı parçalara ayırma (chunking) yöntemleri Exercise 6: Eşikleri değiştirme Exercise 7: Sonuçlarla etkileşim Exercise 8: İş değeri hesaplama ve tahmin Exercise 9: İş değeri hesaplama Exercise 10: Parasal değerde düşüş Exercise 11: Otel rezervasyonu veri kümesi için iş değeri hesabı

Otel rezervasyonu modelindeki performans düşüşünü tespit ettikten sonra, şimdi buna neden olan temel sorunu nasıl belirleyeceğini öğreneceksin. Bu bölümde çok değişkenli ve tek değişkenli sürüklenme (drift) tespit yöntemlerine giriş yapacaksın. Ayrıca veri kalitesi sorunlarını nasıl belirleyeceğini ve saptadığın temel problemleri nasıl ele alacağını öğreneceksin.

Exercise 1: Çok değişkenli sürüklenme tespiti Exercise 2: İlgili kaymaları belirleme Exercise 3: Otel rezervasyonu veri kümesinde kayma (drift)

Geçerli egzersiz

Exercise 4: Tek değişkenli kayma tespiti Exercise 5: Otel rezervasyonu veri kümesi için tek değişkenli kayma tespiti Exercise 6: Tek değişkenli sonuçları sıralama Exercise 7: Drift eden özellikleri görselleştirme Exercise 8: Veri kalitesi ve istatistik kontrolleri Exercise 9: Veri kalitesi kontrolleri Exercise 10: Özet istatistikleri Exercise 11: Sorun çözümü Exercise 12: Çözüm nedir?Exercise 13: Hiçbir şey yapmalı mısın, yapmamalı mısın?Exercise 14: Bir izleme iş akışı uygulama Exercise 15: Tebrikler