HELM è un framework standardizzato per la valutazione di modelli di grandi dimensioni, sviluppato dall'Università di Stanford. Il suo obiettivo è risolvere il problema della mancanza di standard unificati nell'attuale valutazione dei modelli di intelligenza artificiale attraverso un'analisi quantitativa multidimensionale.