Évaluation des modèles d'IA MMLU – Banc d'évaluation de la compréhension du langage multitâche à grande échelle MMLU est un banc d'essai de compréhension du langage multitâche à grande échelle utilisé pour évaluer les capacités de compréhension et de raisonnement globales des modèles d'IA dans un large éventail de domaines de connaissances.