Evaluación de modelos a gran escala

Evaluación de modelos de IA HELM – Sistema de Evaluación de Modelos a Gran Escala de la Universidad de Stanford

HELM es un marco estandarizado para la evaluación de modelos a gran escala, desarrollado por la Universidad de Stanford. Su objetivo es resolver el problema de la falta de estándares unificados en la evaluación actual de modelos de IA mediante análisis cuantitativos multidimensionales.