HELM es un marco estandarizado para la evaluación de modelos a gran escala, desarrollado por la Universidad de Stanford. Su objetivo es resolver el problema de la falta de estándares unificados en la evaluación actual de modelos de IA mediante análisis cuantitativos multidimensionales.