C-Eval 是一个旨在评估中文基础模型综合能力的全面评估套件,为大语言模型的中文能力提供标准化衡量基准。
CMMLU 是一个综合性的大模型中文评估基准,旨在为衡量大语言模型的中文能力提供客观、全面的度量标准。