ResoHub
  • Navegação de ferramentas de IA
    • Ferramentas de apresentação com IA
    • Ferramenta de inspeção de conteúdo por IA
    • ferramentas de escrita com IA
    • Ferramentas de escritório com IA
    • Ferramentas de IA para imagens
    • Site de aprendizagem de IA
    • Ferramenta de remoção de fundo por IA
    • Ferramenta de prompt de IA
    • Mecanismo de busca de IA
    • ferramentas de eficiência de IA
    • ferramentas de documentos de IA
    • Agente inteligente de IA
    • estrutura de IA
    • modelo de IA
    • Avaliação de Modelo de IA
    • geração de pintura por IA
    • ferramentas de programação de IA
    • chatbot de IA
    • ferramentas de vídeo com IA
    • ferramentas de design de IA
    • ferramentas de áudio de IA
    • Melhores ferramentas de IA para imagens
  • Tutorial de Ferramentas de IA
  • Recursos de software
    • Aplicativo Android
    • Aplicativo iOS
    • Software para Mac
    • Software Windows
    • Software de escritório
    • Ferramentas de desenvolvimento
  • Ferramentas online
    • Baixar ferramentas
    • Ferramentas de imagem
    • Conversão de arquivos
    • Ferramentas de vídeo
  • Navegação de ferramentas de IA
    • Ferramentas de apresentação com IA
    • Ferramenta de inspeção de conteúdo por IA
    • ferramentas de escrita com IA
    • Ferramentas de escritório com IA
    • Ferramentas de IA para imagens
    • Site de aprendizagem de IA
    • Ferramenta de remoção de fundo por IA
    • Ferramenta de prompt de IA
    • Mecanismo de busca de IA
    • ferramentas de eficiência de IA
    • ferramentas de documentos de IA
    • Agente inteligente de IA
    • estrutura de IA
    • modelo de IA
    • Avaliação de Modelo de IA
    • geração de pintura por IA
    • ferramentas de programação de IA
    • chatbot de IA
    • ferramentas de vídeo com IA
    • ferramentas de design de IA
    • ferramentas de áudio de IA
    • Melhores ferramentas de IA para imagens
  • Tutorial de Ferramentas de IA
  • Recursos de software
    • Aplicativo Android
    • Aplicativo iOS
    • Software para Mac
    • Software Windows
    • Software de escritório
    • Ferramentas de desenvolvimento
  • Ferramentas online
    • Baixar ferramentas
    • Ferramentas de imagem
    • Conversão de arquivos
    • Ferramentas de vídeo
  1. primeira página
  2. Navegação de ferramentas de IA
  3. Avaliação de Modelo de IA
  4. Lista de artigos
MagicArena – 字节跳动视觉生成模型对战评测平台

Avaliação de Modelo de IA MagicArena – Plataforma de competição e avaliação de modelos visuais generativos da ByteDance

MagicArena é uma plataforma de competição de modelos de geração visual criada pela ByteDance, que avalia objetivamente as capacidades de geração de imagens por IA através de testes comparativos.

272Segunda leitura 01 comentário
Avaliação de Modelo de IA 3 de novembro de 2025
AGI-Eval – AI大模型评测社区

Avaliação de Modelo de IA AGI-Eval – Comunidade de Avaliação de Grandes Modelos de IA

AGI-Eval é uma comunidade profissional focada na avaliação das capacidades de grandes modelos de IA, com o objetivo de fornecer aos usuários referências de desempenho do modelo por meio de avaliações sistemáticas.

209Segunda leitura 01 comentário
Avaliação de Modelo de IA 18 de dezembro de 2024
H2O EvalGPT – 基于 Elo 评级的 AI 大模型评估系统

Avaliação de Modelo de IA H2O EvalGPT – Um sistema de avaliação de modelos de grande porte com IA baseado na classificação Elo.

O H2O EvalGPT é uma ferramenta de avaliação de modelos de IA de grande porte baseada no algoritmo de classificação Elo, que fornece classificações objetivas do desempenho do modelo por meio de comparação quantitativa.

266Segunda leitura 01 comentário
Avaliação de Modelo de IA 2023年10月29日
LLMEval3 – 复旦大学大模型评测基准

Avaliação de Modelo de IA LLMEval3 – 复旦大学大模型评测基准

LLMEval3 是由复旦大学 NLP 实验室研发的大模型评测基准,专注于提供客观且标准化的 AI 模型能力评估。

225Segunda leitura 01 comentário
Avaliação de Modelo de IA 2023年10月29日
MMBench – 全方位的多模态大模型能力评测体系

Avaliação de Modelo de IA MMBench – 全方位的多模态大模型能力评测体系

MMBench 是一个针对多模态大模型设计的全面评测体系,旨在提供客观、标准的能力量化分析。

229Segunda leitura 01 comentário
Avaliação de Modelo de IA 2023年10月29日
HELM – 斯坦福大学大模型评测体系

Avaliação de Modelo de IA HELM – 斯坦福大学大模型评测体系

HELM 是斯坦福大学开发的一套标准化大模型评测框架,旨在通过多维度的量化分析,解决当前 AI 模型评估缺乏统一标准的问题。

224Segunda leitura 01 comentário
Avaliação de Modelo de IA 2023年10月29日
OpenCompass – 大模型开放评测体系

Avaliação de Modelo de IA OpenCompass – 大模型开放评测体系

OpenCompass 是由上海人工智能实验室打造的专业大模型评测体系,旨在通过标准化的评估流程量化 AI 模型的实际能力。

268Segunda leitura 01 comentário
Avaliação de Modelo de IA 2023年10月29日
FlagEval (天秤) – 智源研究院大模型评测平台

Avaliação de Modelo de IA FlagEval (天秤) – 智源研究院大模型评测平台

FlagEval(天秤)是智源研究院打造的专业大模型评测平台,为AI模型提供标准化的能力量化评估。

282Segunda leitura 01 comentário
Avaliação de Modelo de IA 2023年10月29日
LMArena – 权威的 AI 大模型竞技场评测平台

Avaliação de Modelo de IA LMArena – 权威的 AI 大模型竞技场评测平台

LMArena 是一个基于众包对比的 AI 模型评测平台,通过真实的对话盲测来衡量大语言模型的实际表现。

285Segunda leitura 01 comentário
Avaliação de Modelo de IA 2023年10月29日
MMLU – 大规模多任务语言理解基准

Avaliação de Modelo de IA MMLU – 大规模多任务语言理解基准

MMLU 是一个大规模多任务语言理解基准,用于评估 AI 模型在广泛知识领域内的综合理解与推理能力。

249Segunda leitura 01 comentário
Avaliação de Modelo de IA 2023年10月29日
  • 1
  • 2
  • »
关于我们

ResoHub 是一个免费资源与工具分享平台,聚合 AI 工具、软件与实用数字资源,帮助用户高效发现优质工具与服务。

所有内容均来源于公开互联网或用户投稿,仅供信息参考。

官方渠道: X(Twitter) | Telegram 频道

版权说明

ResoHub 所展示的第三方资源版权归原作者所有。本站仅作为信息整理与分享平台,不拥有相关内容版权,也不保证其可用性与安全性。如有侵权,请联系我们处理。