Avaliação de Modelo de IA MMLU – Avaliação comparativa de compreensão de linguagem multitarefa em larga escala MMLU é um benchmark de compreensão de linguagem multitarefa em larga escala, usado para avaliar a capacidade de compreensão e raciocínio abrangentes de modelos de IA em uma ampla gama de domínios de conhecimento.