Análise comparativa de modelos de linguagem

Avaliação de Modelo de IA MMLU – Avaliação comparativa de compreensão de linguagem multitarefa em larga escala

MMLU é um benchmark de compreensão de linguagem multitarefa em larga escala, usado para avaliar a capacidade de compreensão e raciocínio abrangentes de modelos de IA em uma ampla gama de domínios de conhecimento.