Analyse comparative des modèles de langage

Évaluation des modèles d'IA MMLU – Banc d'évaluation de la compréhension du langage multitâche à grande échelle

MMLU est un banc d'essai de compréhension du langage multitâche à grande échelle utilisé pour évaluer les capacités de compréhension et de raisonnement globales des modèles d'IA dans un large éventail de domaines de connaissances.