中文基准测试 - ResoHub

C-Eval：全面的中文基础模型评估套件

AI模型评测 C-Eval：全面的中文基础模型评估套件

C-Eval 是一个旨在评估中文基础模型综合能力的全面评估套件，为大语言模型的中文能力提供标准化衡量基准。

236次阅读 0个评论

AI模型评测 2023年10月29日

CMMLU – 综合性大模型中文评估基准

AI模型评测 CMMLU – 综合性大模型中文评估基准

CMMLU 是一个综合性的大模型中文评估基准，旨在为衡量大语言模型的中文能力提供客观、全面的度量标准。

189次阅读 0个评论

AI模型评测 2023年10月29日