Appliquer la quantification dynamique
Vous avez formé avec succès un modèle de réseau neuronal en vue de son déploiement et vous souhaitez maintenant l'optimiser à l'aide de la quantification dynamique. Cette étape est cruciale pour déployer efficacement votre modèle dans des environnements aux ressources limitées.
Le logiciel de gestion de la santé et de la sécurité au travail « model
» a été préinstallé.
Cet exercice fait partie du cours
Modèles d'IA évolutifs avec PyTorch Lightning
Instructions
- Importez le module de quantification nécessaire depuis PyTorch.
- Appliquez une quantification dynamique ciblant les couches linéaires, en utilisant une précision entière de 8 bits.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
import torch
# Import the necessary quantization module
from torch.quantization import ____
# Apply dynamic quantization targeting linear layers
model_quantized = torch.quantization.____(
____, {torch.nn.____}, dtype=torch.____
)