ResoHub
  • AI工具
    • AI写作工具
    • AI办公工具
    • AI绘图工具
    • AI视频工具
    • ChatGPT工具
  • 软件资源
    • Android应用
    • iOS应用
    • Mac软件
    • Windows软件
    • 办公软件
    • 开发工具
  • 网络工具
    • Telegram代理
    • 机场订阅
    • 网络教程
  • 在线工具
    • 下载工具
    • 图片工具
    • 文件转换
    • 视频工具
  • 账号资源
    • Apple ID共享
    • 临时邮箱
  • 资源合集
    • AI合集推荐
    • 学习资源合集
    • 电影合集
    • 软件合集
  • AI工具
    • AI写作工具
    • AI办公工具
    • AI绘图工具
    • AI视频工具
    • ChatGPT工具
  • 软件资源
    • Android应用
    • iOS应用
    • Mac软件
    • Windows软件
    • 办公软件
    • 开发工具
  • 网络工具
    • Telegram代理
    • 机场订阅
    • 网络教程
  • 在线工具
    • 下载工具
    • 图片工具
    • 文件转换
    • 视频工具
  • 账号资源
    • Apple ID共享
    • 临时邮箱
  • 资源合集
    • AI合集推荐
    • 学习资源合集
    • 电影合集
    • 软件合集
  1. 首页
  2. AI工具导航
  3. AI模型评测
  4. 文章列表
C-Eval:全面的中文基础模型评估套件

AI模型评测 C-Eval:全面的中文基础模型评估套件

C-Eval 是一个旨在评估中文基础模型综合能力的全面评估套件,为大语言模型的中文能力提供标准化衡量基准。

18次阅读 0个评论
AI模型评测 2023年10月29日
SuperCLUE – 中文通用大模型综合性测评基准

AI模型评测 SuperCLUE – 中文通用大模型综合性测评基准

SuperCLUE 是一款专业的中文通用大模型综合性测评基准,致力于为大语言模型的中文能力提供客观、权威的量化评估。

18次阅读 0个评论
AI模型评测 2023年10月29日
Open LLM Leaderboard – 开源大模型评测排行榜

AI模型评测 Open LLM Leaderboard – 开源大模型评测排行榜

由 Hugging Face 维护的开源大模型性能基准排行榜,提供透明、标准化的模型能力量化对比。

13次阅读 0个评论
AI模型评测 2023年10月29日
CMMLU – 综合性大模型中文评估基准

AI模型评测 CMMLU – 综合性大模型中文评估基准

CMMLU 是一个综合性的大模型中文评估基准,旨在为衡量大语言模型的中文能力提供客观、全面的度量标准。

12次阅读 0个评论
AI模型评测 2023年10月29日
PubMedQA – 生物医学研究问答数据集与评测基准

AI模型评测 PubMedQA – 生物医学研究问答数据集与评测基准

PubMedQA 为生物医学研究提供专业的问答数据集,并通过模型得分排行榜量化 AI 在医学领域的表现。

17次阅读 0个评论
AI模型评测 2023年10月29日
  • «
  • 1
  • 2
关于我们

ResoHub 是一个免费资源与工具分享平台,聚合 AI 工具、软件与实用数字资源,帮助用户高效发现优质工具与服务。

所有内容均来源于公开互联网或用户投稿,仅供信息参考。

官方渠道: X(Twitter) | Telegram 频道

版权说明

ResoHub 所展示的第三方资源版权归原作者所有。本站仅作为信息整理与分享平台,不拥有相关内容版权,也不保证其可用性与安全性。如有侵权,请联系我们处理。