模型基准测试 - ResoHub

AGI-Eval – AI大模型评测社区

AI模型评测 AGI-Eval – AI大模型评测社区

AGI-Eval 是一个专注于 AI 大模型能力评估的专业社区，旨在通过系统化的评测为用户提供模型性能参考。

217次阅读 0个评论

AI模型评测 2024年12月18日

LMArena – 权威的 AI 大模型竞技场评测平台

AI模型评测 LMArena – 权威的 AI 大模型竞技场评测平台

LMArena 是一个基于众包对比的 AI 模型评测平台，通过真实的对话盲测来衡量大语言模型的实际表现。

295次阅读 0个评论

AI模型评测 2023年10月29日

Open LLM Leaderboard – 开源大模型评测排行榜

AI模型评测 Open LLM Leaderboard – 开源大模型评测排行榜

由 Hugging Face 维护的开源大模型性能基准排行榜，提供透明、标准化的模型能力量化对比。

246次阅读 0个评论

AI模型评测 2023年10月29日