BaşlayınÜcretsiz Başlayın

Kuantize edilmiş model performansını karşılaştırma

Performans iyileştirmelerini anlamak sadece doğrulukla ilgili değildir. Kuantize edilmiş modeller genellikle daha hızlı çıkarım süreleri sunar — bu da dağıtım senaryolarında önemli bir avantajdır. Hem orijinal hem de kuantize edilmiş modellerin test kümesini işlemesinin ne kadar sürdüğünü ölçeceksin.

measure_time() fonksiyonu önceden tanımlandı. Modeli değerlendirme moduna alır, veri yükleyicideki tüm yığınlar üzerinde bir ileri geçiş çalıştırır ve geçen süreyi döndürür.

model (orijinal model) ve model_quantized (kuantize edilmiş sürüm) ile test_loader önceden yüklendi.

Bu egzersiz

PyTorch Lightning ile Ölçeklenebilir AI Modelleri

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Orijinal ve kuantize edilmiş modeller için çıkarım süresini hesapla.
  • Her iki süreyi de iki ondalığa yuvarlanmış olarak yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Measure inference time of the original model
original_time = measure_time(____)

# Measure inference time of the quantized model
quant_time = measure_time(____)

# Print results
print(f"Original Model Time: {____}s")
print(f"Quantized Model Time: {____}s")
Kodu Düzenle ve Çalıştır