HELM est un cadre d'évaluation standardisé pour les grands modèles, développé par l'Université de Stanford. Il vise à résoudre le problème du manque de normes unifiées dans l'évaluation actuelle des modèles d'IA grâce à une analyse quantitative multidimensionnelle.