MulaiMulai sekarang secara gratis

Membandingkan kinerja model terkuantisasi

Memahami peningkatan kinerja tidak hanya soal akurasi. Model yang dikuantisasi sering memberikan waktu inferensi yang lebih cepat—keunggulan utama dalam skenario deployment. Anda akan mengukur berapa lama waktu yang dibutuhkan model asli dan model terkuantisasi untuk memproses himpunan uji.

Fungsi measure_time() telah didefinisikan. Fungsi ini mengatur model ke mode evaluasi, menjalankan forward pass pada semua batch di dataloader, dan mengembalikan waktu yang berlalu.

model (model asli) dan model_quantized (versi terkuantisasi) telah dimuat bersama dengan test_loader.

Latihan ini adalah bagian dari kursus

Model AI yang Dapat Diskalakan dengan PyTorch Lightning

Lihat Kursus

Petunjuk latihan

  • Hitung waktu inferensi untuk model asli dan model terkuantisasi.
  • Cetak kedua waktu tersebut dengan pembulatan dua angka desimal.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Measure inference time of the original model
original_time = measure_time(____)

# Measure inference time of the quantized model
quant_time = measure_time(____)

# Print results
print(f"Original Model Time: {____}s")
print(f"Quantized Model Time: {____}s")
Edit dan Jalankan Kode