Deteksi drift univariat untuk himpunan data pemesanan hotel
Pada latihan sebelumnya, kita menetapkan menggunakan metode deteksi drift multivariat bahwa pergeseran data pada bulan Januari menjadi penyebab peringatan pada metrik ROC AUC dan nilai bisnis model yang negatif.
Pada latihan ini, Anda akan menggunakan metode deteksi drift univariat untuk menemukan fitur dan penjelasan di balik drift tersebut.
Himpunan reference dan analysis sudah dimuat sebelumnya untuk Anda.
Latihan ini adalah bagian dari kursus
Pemantauan Machine Learning dengan Python
Petunjuk latihan
- Tentukan metode Wasserstein dan Jensen-Shannon untuk variabel kontinu serta L-infinity dan Chi2 untuk variabel kategorikal.
- Latih pada himpunan reference dan hitung hasil pada himpunan analysis.
- Visualisasikan hasilnya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Intialize the univariate drift calculator
uv_calc = nannyml.UnivariateDriftCalculator(
column_names=feature_column_names,
timestamp_column_name='timestamp',
chunk_period='m',
continuous_methods=[____, ____],
categorical_methods=[____, ____],
)
# Plot the results
uv_calc.____(reference)
uv_results = uv_calc.____(analysis)
____.____().____()