Dans ce chapitre, nous nous penchons sur les principales considérations à prendre en compte lors de la formation de LLMs, telles que la disponibilité de grandes données, la qualité des données, l'exactitude de l'étiquetage et les implications des données biaisées. Vous examinerez également divers risques sur le site LLM, tels que la confidentialité des données, les préoccupations éthiques et l'impact sur l'environnement. Enfin, le chapitre se termine par une discussion sur les domaines de recherche émergents et sur l'évolution du paysage de LLMs.