ComeçarComece de graça

Aplicar quantização dinâmica

Você treinou com sucesso um modelo de rede neural para implantação e agora quer otimizá-lo usando quantização dinâmica. Essa etapa é super importante pra implantar seu modelo de forma eficiente em ambientes com recursos limitados.

O aplicativo “ model ” já está instalado.

Este exercício faz parte do curso

Modelos de IA escaláveis com PyTorch Lightning

Ver curso

Instruções do exercício

  • Importa o módulo de quantização necessário do PyTorch.
  • Aplique quantização dinâmica direcionada a camadas lineares, usando precisão inteira de 8 bits.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

import torch
# Import the necessary quantization module
from torch.quantization import ____

# Apply dynamic quantization targeting linear layers
model_quantized = torch.quantization.____(
    ____, {torch.nn.____}, dtype=torch.____
)
Editar e executar o código