ResoHub
  • KI-Tools-Navigation
    • KI-Präsentationstools
    • KI-Inhaltsprüfungstool
    • KI-Schreibwerkzeuge
    • KI-Bürotools
    • KI-Bildbearbeitungswerkzeuge
    • Website zum Thema KI-Lernen
    • KI-Hintergrundentfernungstool
    • KI-gestütztes Eingabeaufforderungstool
    • KI-Suchmaschine
    • KI-Effizienzwerkzeuge
    • KI-Dokumententools
    • KI-intelligenter Agent
    • KI-Framework
    • KI-Modell
    • KI-Modellbewertung
    • KI-Gemäldegenerierung
    • KI-Programmierwerkzeuge
    • KI-Chatbot
    • KI-Videotools
    • KI-Designwerkzeuge
    • KI-Audio-Tools
    • Die besten KI-Bildbearbeitungswerkzeuge
  • Tutorial zu KI-Tools
  • Software-Ressourcen
    • Android-Anwendung
    • iOS-App
    • Mac-Software
    • Windows-Software
    • Office-Software
    • Entwicklungswerkzeuge
  • Online-Tools
    • Tools herunterladen
    • Bildbearbeitungswerkzeuge
    • Dateikonvertierung
    • Videotools
  • KI-Tools-Navigation
    • KI-Präsentationstools
    • KI-Inhaltsprüfungstool
    • KI-Schreibwerkzeuge
    • KI-Bürotools
    • KI-Bildbearbeitungswerkzeuge
    • Website zum Thema KI-Lernen
    • KI-Hintergrundentfernungstool
    • KI-gestütztes Eingabeaufforderungstool
    • KI-Suchmaschine
    • KI-Effizienzwerkzeuge
    • KI-Dokumententools
    • KI-intelligenter Agent
    • KI-Framework
    • KI-Modell
    • KI-Modellbewertung
    • KI-Gemäldegenerierung
    • KI-Programmierwerkzeuge
    • KI-Chatbot
    • KI-Videotools
    • KI-Designwerkzeuge
    • KI-Audio-Tools
    • Die besten KI-Bildbearbeitungswerkzeuge
  • Tutorial zu KI-Tools
  • Software-Ressourcen
    • Android-Anwendung
    • iOS-App
    • Mac-Software
    • Windows-Software
    • Office-Software
    • Entwicklungswerkzeuge
  • Online-Tools
    • Tools herunterladen
    • Bildbearbeitungswerkzeuge
    • Dateikonvertierung
    • Videotools
  1. Titelseite
  2. KI-Tools-Navigation
  3. KI-Modellbewertung
  4. Artikelliste
MagicArena – 字节跳动视觉生成模型对战评测平台

KI-Modellbewertung MagicArena – ByteDances Plattform für Wettbewerbe und Bewertungen visueller generativer Modelle

MagicArena ist eine von ByteDance entwickelte Wettbewerbsplattform für visuelle Generierungsmodelle, die die Fähigkeiten von KI-gestützten Bildgenerierungsmodellen durch vergleichende Tests objektiv bewertet.

308Zweite Lesung 01 Kommentar
KI-Modellbewertung 3. November 2025
AGI-Eval – AI大模型评测社区

KI-Modellbewertung AGI-Eval – Community für die Bewertung großer KI-Modelle

AGI-Eval ist eine professionelle Community, die sich auf die Bewertung der Leistungsfähigkeit großer KI-Modelle konzentriert und darauf abzielt, den Nutzern durch systematische Evaluierungen Referenzwerte für die Modellleistung bereitzustellen.

244Zweite Lesung 01 Kommentar
KI-Modellbewertung 18. Dezember 2024
H2O EvalGPT – 基于 Elo 评级的 AI 大模型评估系统

KI-Modellbewertung H2O EvalGPT – Ein KI-basiertes System zur Bewertung großer Modelle auf Basis der Elo-Wertung

H2O EvalGPT ist ein KI-gestütztes Tool zur Bewertung großer Modelle, das auf dem Elo-Bewertungsalgorithmus basiert und durch quantitativen Vergleich eine objektive Rangfolge der Modellleistung ermöglicht.

291Zweite Lesung 01 Kommentar
KI-Modellbewertung 2023年10月29日
LLMEval3 – 复旦大学大模型评测基准

KI-Modellbewertung LLMEval3 – 复旦大学大模型评测基准

LLMEval3 是由复旦大学 NLP 实验室研发的大模型评测基准,专注于提供客观且标准化的 AI 模型能力评估。

245Zweite Lesung 01 Kommentar
KI-Modellbewertung 2023年10月29日
MMBench – 全方位的多模态大模型能力评测体系

KI-Modellbewertung MMBench – 全方位的多模态大模型能力评测体系

MMBench 是一个针对多模态大模型设计的全面评测体系,旨在提供客观、标准的能力量化分析。

248Zweite Lesung 01 Kommentar
KI-Modellbewertung 2023年10月29日
HELM – 斯坦福大学大模型评测体系

KI-Modellbewertung HELM – 斯坦福大学大模型评测体系

HELM 是斯坦福大学开发的一套标准化大模型评测框架,旨在通过多维度的量化分析,解决当前 AI 模型评估缺乏统一标准的问题。

246Zweite Lesung 01 Kommentar
KI-Modellbewertung 2023年10月29日
OpenCompass – 大模型开放评测体系

KI-Modellbewertung OpenCompass – 大模型开放评测体系

OpenCompass 是由上海人工智能实验室打造的专业大模型评测体系,旨在通过标准化的评估流程量化 AI 模型的实际能力。

291Zweite Lesung 01 Kommentar
KI-Modellbewertung 2023年10月29日
FlagEval (天秤) – 智源研究院大模型评测平台

KI-Modellbewertung FlagEval (天秤) – 智源研究院大模型评测平台

FlagEval(天秤)是智源研究院打造的专业大模型评测平台,为AI模型提供标准化的能力量化评估。

302Zweite Lesung 01 Kommentar
KI-Modellbewertung 2023年10月29日
LMArena – 权威的 AI 大模型竞技场评测平台

KI-Modellbewertung LMArena – 权威的 AI 大模型竞技场评测平台

LMArena 是一个基于众包对比的 AI 模型评测平台,通过真实的对话盲测来衡量大语言模型的实际表现。

315Zweite Lesung 01 Kommentar
KI-Modellbewertung 2023年10月29日
MMLU – 大规模多任务语言理解基准

KI-Modellbewertung MMLU – 大规模多任务语言理解基准

MMLU 是一个大规模多任务语言理解基准,用于评估 AI 模型在广泛知识领域内的综合理解与推理能力。

279Zweite Lesung 01 Kommentar
KI-Modellbewertung 2023年10月29日
  • 1
  • 2
  • »
关于我们

ResoHub 是一个免费资源与工具分享平台,聚合 AI 工具、软件与实用数字资源,帮助用户高效发现优质工具与服务。

所有内容均来源于公开互联网或用户投稿,仅供信息参考。

官方渠道: X(Twitter) | Telegram 频道

版权说明

ResoHub 所展示的第三方资源版权归原作者所有。本站仅作为信息整理与分享平台,不拥有相关内容版权,也不保证其可用性与安全性。如有侵权,请联系我们处理。