LLMEval3 es un conjunto de datos de referencia para la evaluación de modelos a gran escala, desarrollado por el Laboratorio de Procesamiento del Lenguaje Natural (PLN) de la Universidad de Fudan, que se centra en proporcionar evaluaciones objetivas y estandarizadas de las capacidades de los modelos de IA.