ResoHub
  • Navigation dans les outils d'IA
    • Outils de présentation IA
    • outil d'inspection de contenu par IA
    • outils d'écriture IA
    • AI办公工具
    • Outils d'imagerie IA
    • site web d'apprentissage de l'IA
    • Outil de suppression d'arrière-plan par IA
    • Outil d'invite IA
    • moteur de recherche IA
    • outils d'efficacité de l'IA
    • outils de documentation IA
    • agent intelligent IA
    • cadre d'IA
    • Modèle d'IA
    • Évaluation des modèles d'IA
    • génération de peinture par IA
    • outils de programmation d'IA
    • chatbot IA
    • outils vidéo IA
    • outils de conception d'IA
    • outils audio IA
    • Meilleurs outils d'imagerie IA
  • Tutoriel sur les outils d'IA
  • Ressources logicielles
    • application Android
    • Application iOS
    • Logiciel Mac
    • Logiciel Windows
    • Logiciels bureautiques
    • Outils de développement
  • Outils en ligne
    • Outils de téléchargement
    • Outils d'imagerie
    • Conversion de fichiers
    • Outils vidéo
  • Navigation dans les outils d'IA
    • Outils de présentation IA
    • outil d'inspection de contenu par IA
    • outils d'écriture IA
    • AI办公工具
    • Outils d'imagerie IA
    • site web d'apprentissage de l'IA
    • Outil de suppression d'arrière-plan par IA
    • Outil d'invite IA
    • moteur de recherche IA
    • outils d'efficacité de l'IA
    • outils de documentation IA
    • agent intelligent IA
    • cadre d'IA
    • Modèle d'IA
    • Évaluation des modèles d'IA
    • génération de peinture par IA
    • outils de programmation d'IA
    • chatbot IA
    • outils vidéo IA
    • outils de conception d'IA
    • outils audio IA
    • Meilleurs outils d'imagerie IA
  • Tutoriel sur les outils d'IA
  • Ressources logicielles
    • application Android
    • Application iOS
    • Logiciel Mac
    • Logiciel Windows
    • Logiciels bureautiques
    • Outils de développement
  • Outils en ligne
    • Outils de téléchargement
    • Outils d'imagerie
    • Conversion de fichiers
    • Outils vidéo
  1. première page
  2. Navigation dans les outils d'IA
  3. Évaluation des modèles d'IA
  4. Liste d'articles
MagicArena – 字节跳动视觉生成模型对战评测平台

Évaluation des modèles d'IA MagicArena – la plateforme de compétition et d'évaluation de modèles génératifs visuels de ByteDance

MagicArena est une plateforme de compétition de modèles de génération visuelle créée par ByteDance, qui évalue objectivement les capacités de génération d'images par IA grâce à des tests comparatifs.

272Deuxième lecture 01 commentaire
Évaluation des modèles d'IA 3 novembre 2025
AGI-Eval – AI大模型评测社区

Évaluation des modèles d'IA AGI-Eval – Communauté d'évaluation des grands modèles d'IA

AGI-Eval est une communauté professionnelle axée sur l'évaluation des capacités des grands modèles d'IA, visant à fournir aux utilisateurs des références de performance des modèles grâce à des évaluations systématiques.

209Deuxième lecture 01 commentaire
Évaluation des modèles d'IA 18 décembre 2024
H2O EvalGPT – 基于 Elo 评级的 AI 大模型评估系统

Évaluation des modèles d'IA H2O EvalGPT – Un système d'évaluation de modèles d'IA de grande taille basé sur le classement Elo

H2O EvalGPT est un outil d'évaluation de modèles d'IA de grande taille basé sur l'algorithme de notation Elo, qui fournit des classements objectifs des performances des modèles grâce à une comparaison quantitative.

266Deuxième lecture 01 commentaire
Évaluation des modèles d'IA 29 octobre 2023
LLMEval3 – 复旦大学大模型评测基准

Évaluation des modèles d'IA LLMEval3 – Banc d'évaluation des grands modèles de l'Université Fudan

LLMEval3 est un banc d'essai d'évaluation de modèles à grande échelle développé par le laboratoire NLP de l'université Fudan, visant à fournir des évaluations objectives et standardisées des capacités des modèles d'IA.

225Deuxième lecture 01 commentaire
Évaluation des modèles d'IA 29 octobre 2023
MMBench – 全方位的多模态大模型能力评测体系

Évaluation des modèles d'IA MMBench – Un système d'évaluation complet des capacités des grands modèles multimodaux

MMBench est un système d'évaluation complet conçu pour les grands modèles multimodaux, visant à fournir une analyse quantitative objective et standardisée des capacités.

229Deuxième lecture 01 commentaire
Évaluation des modèles d'IA 29 octobre 2023
HELM – 斯坦福大学大模型评测体系

Évaluation des modèles d'IA HELM – Système d'évaluation des grands modèles de l'Université de Stanford

HELM est un cadre d'évaluation standardisé pour les grands modèles, développé par l'Université de Stanford. Il vise à résoudre le problème du manque de normes unifiées dans l'évaluation actuelle des modèles d'IA grâce à une analyse quantitative multidimensionnelle.

224Deuxième lecture 01 commentaire
Évaluation des modèles d'IA 29 octobre 2023
OpenCompass – 大模型开放评测体系

Évaluation des modèles d'IA OpenCompass – Un système d'évaluation ouvert pour les grands modèles

OpenCompass est un système d'évaluation de modèles à grande échelle développé par le Laboratoire d'intelligence artificielle de Shanghai. Il vise à quantifier les capacités réelles des modèles d'IA grâce à un processus d'évaluation standardisé.

268Deuxième lecture 01 commentaire
Évaluation des modèles d'IA 29 octobre 2023
FlagEval (天秤) – 智源研究院大模型评测平台

Évaluation des modèles d'IA FlagEval (天秤) – 智源研究院大模型评测平台

FlagEval(天秤)是智源研究院打造的专业大模型评测平台,为AI模型提供标准化的能力量化评估。

282Deuxième lecture 01 commentaire
Évaluation des modèles d'IA 29 octobre 2023
LMArena – 权威的 AI 大模型竞技场评测平台

Évaluation des modèles d'IA LMArena – 权威的 AI 大模型竞技场评测平台

LMArena 是一个基于众包对比的 AI 模型评测平台,通过真实的对话盲测来衡量大语言模型的实际表现。

285Deuxième lecture 01 commentaire
Évaluation des modèles d'IA 29 octobre 2023
MMLU – 大规模多任务语言理解基准

Évaluation des modèles d'IA MMLU – 大规模多任务语言理解基准

MMLU 是一个大规模多任务语言理解基准,用于评估 AI 模型在广泛知识领域内的综合理解与推理能力。

249Deuxième lecture 01 commentaire
Évaluation des modèles d'IA 29 octobre 2023
  • 1
  • 2
  • »
关于我们

ResoHub 是一个免费资源与工具分享平台,聚合 AI 工具、软件与实用数字资源,帮助用户高效发现优质工具与服务。

所有内容均来源于公开互联网或用户投稿,仅供信息参考。

官方渠道: X(Twitter) | Telegram 频道

版权说明

ResoHub 所展示的第三方资源版权归原作者所有。本站仅作为信息整理与分享平台,不拥有相关内容版权,也不保证其可用性与安全性。如有侵权,请联系我们处理。