CommencerCommencez gratuitement

Appliquer la quantification dynamique

Vous avez formé avec succès un modèle de réseau neuronal en vue de son déploiement et vous souhaitez maintenant l'optimiser à l'aide de la quantification dynamique. Cette étape est cruciale pour déployer efficacement votre modèle dans des environnements aux ressources limitées.

Le logiciel de gestion de la santé et de la sécurité au travail « model » a été préinstallé.

Cet exercice fait partie du cours

<cours>Modèles d'IA évolutifs avec PyTorch Lightning</cours>
Voir le cours

Instructions de l’exercice

  • Importez le module de quantification nécessaire depuis PyTorch.
  • Appliquez une quantification dynamique ciblant les couches linéaires, en utilisant une précision entière de 8 bits.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

import torch
# Import the necessary quantization module
from torch.quantization import ____

# Apply dynamic quantization targeting linear layers
model_quantized = torch.quantization.____(
    ____, {torch.nn.____}, dtype=torch.____
)
Modifier et exécuter le code