O HELM é uma estrutura padronizada para avaliação de modelos de grande porte, desenvolvida pela Universidade de Stanford. Seu objetivo é solucionar o problema da falta de padrões unificados na avaliação atual de modelos de IA por meio de análises quantitativas multidimensionais.