Definir recetas personalizadas
Estás ajustando mediante fine-tuning un modelo Llama preentrenado para un cliente que necesita configuraciones específicas. Tu plan es usar TorchTune para el fine-tuning, así que necesitas preparar un diccionario de Python donde guardar los requisitos de la receta personalizada que usarás para ejecutar la tarea de fine-tuning.
Este ejercicio forma parte del curso
Ajuste fino con Llama 3
Instrucciones del ejercicio
- Especifica los requisitos del cliente en tu diccionario: primero, añade el modelo
torchtune.models.llama3_2.llama3_2_1b. - Añade un tamaño de lote de 8 y un dispositivo GPU.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
config_dict = {
# Define the model
____,
# Define the batch size
____,
# Define the device type
____,
"epochs": 15,
"optimizer": {"_component_": "bitsandbytes.optim.PagedAdamW8bit", "lr": 3e-05},
"dataset": {"_component_": "custom_dataset"},
"output_dir": "/tmp/finetune_results"
}