Aplicar cuantificación dinámica
Has entrenado correctamente un modelo de red neuronal para su implementación y ahora deseas optimizarlo mediante cuantificación dinámica. Este paso es crucial para implementar tu modelo de manera eficiente en entornos con recursos limitados.
Se ha precargado el programa « model
».
Este ejercicio forma parte del curso
Modelos de IA escalables con PyTorch Lightning
Instrucciones del ejercicio
- Importa el módulo de cuantificación necesario desde PyTorch.
- Aplica una cuantificación dinámica dirigida a capas lineales, utilizando una precisión de 8 bits enteros.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
import torch
# Import the necessary quantization module
from torch.quantization import ____
# Apply dynamic quantization targeting linear layers
model_quantized = torch.quantization.____(
____, {torch.nn.____}, dtype=torch.____
)